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"الإحصاء مع ستاتا".. مخصص للطلبة والباحثين العمليين» ويهدف إلى 
بد القجرة بين كقب الإحصناء plastid ALT,‏ مكانا. وليس جور هذا القت اب 
elhe]‏ توضيحات مفصلة لكتاب معين» ولا يشرح كل مميزات برنامج ستاتا. 
فهذا الكتاب يوضح كيف يمكن استخدام برنامج ستاتا لإنجاز ..جموعة كبيرة 
من المهام الإحصائية. 

فصول هذا الكتاب تغطي موضوعات عامة Vay‏ من التركير على أوامر 
ستاتا izes‏ وهذا يعطي GUS‏ شكلاً مختلفاً عن أدلة استخدام برنامج ستاتا. 
فمثلاً فصل إدارة البيانات يغطي العديد من الطرق المختلفة لإنشاء أواستيراد 
أودمج أو إعادة cas‏ ملفات البيانات. والفصول الخاصة بالرس-ومات 
البيانية» والإحصائيات الملخصة؛ والجداول» وتحليل التباين» ونماذج المقارنة 
الأخرىء» لها نفس هذه الخطوط العريضة التي تشمل عددًا من التقنيات 
المختلفة. وهناك فصل جديد يعطي مقدمة عن بيانات الدراسات الاستقصائيةء 
والذي تم وضعه ضمن الفصول الأولى من هذا الكتاب» حيث يعطي خلفية 
مع أمثلة عن ذلك في الأماكن المناسبة والفصول اللاحقة. 

cule gria gall‏ العامة لأول سبعة فصول (من بداية تحليل الانحدار 
الخطي) تتناسب مع مادة الإحصاء التطبيقي للدراسات الجامعية» أو 
المستويات الأولى من الدراسات الجامعية» ولكن تم إضافة عمق إضافي 
لتغطية Llai‏ خاصة dale‏ يواجهها المحللون؛ مثل AS‏ استيراد البيانات أو 
الرسومات البيانية لغرض النشر العلمي» أو جودة الأشكال البيانية؛ أو العمل 
مع أوزان الدراسات الاستقصائية» وحل مشاكل الانحدار. أما الفصل "8" 
(طرق انحدار متقدمة) والفصول اللاحقة له»ء فقد قمنا بالانتقال إلى 
موضوعات متقدمة» أو ما يُسمى البحث الواقعي» حيث يمكن للقارئ أن يجد 
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معلومات أساسية وشروحات عن Alla‏ تمهيد لوس» أو الانحدار الموثوق» أو 
الانحدار الربيعي» أو الانحدار غير الخطيء أو الانحدار اللوغاريتميء أو 
الانحدار اللوغاريتمي المرتبء أو الانحدار اللوغاريتمي متعدد الحدود» أو 
انحدار بواسون. وتم تطبيق طرق جديدة لصياغة المعادلة الهيكلية؛ أو 
الحساب المتعدد للقيم المفقودة» ونماذج حساب الأحداث» وزمن البقاء. كما تم 
أيضاً صياغة واستخدام المتغيرات المركبة من التحليل العاملي» أو المكونات 
الرئيسةء حيث تم تقسيم المشاهدات إلى أنواع تجريبية» أوعناقيد» أو تحليل 
سلاسل زمنية متعددة أو بسيطة لتناسب نماذج التأثيرات المختلطة أو متعددة 
المستويات. كما قامت شركة ستاتا بالعمل بجد في السنوات الأخيرة لتطور 
مكانتها الفنية والتقنيةء ويظهر هذا المجهود بوضوح في تعدد أنواع أوامر 
النماذج الإحصائية التي يستخدمها البرنامج الآن. 

كما أن الكتاب يلقي نظرة على البرمجة في ستاتا. حيث يجد العديد من 
ob eT‏ برنامج ستاتا يقوم JS‏ شيء يحتاجونه» ولذلك فليس هناك داع 
لكتابة البرامج الأصلية» بالنسبة للبعضء فإن البرمجة في ستاتا تعتبر إحدى 
الميزات الجذابة التي أدت إلى التطور السريع لهذا البرنامج. 

أما الفصل )14( فيفتح الباب للمستخدمين الجدد لاكتشاف البرمجة في 
ستاتاء وكيفية استخدام هذه البرمجة لأغراض مهام الإدارة المتقدمة للبيانات 
أو غيرهاء حيث يمكن للمستخدمين إنشاء قدرات إحصائية جديدة لتجارب 
مونت كارلو أو لغرض التدريس. 

وعموماء هناك إصدارات متشابهة 'بتنسيقات مختلفة" لبرنامج ستاتاء مع 
أنظمة تشغيل ويندوز وماك ويونيكس. وفي كل أنظمة التشغيل هذه فإن 
برنامج ستاتا يقوم باستخدام نفس الأوامرء ويقوم بإنتاج نفس المخرجات: كما 
أن البيانات» والأشكال البيانية» والبرامج التي يتم إنشاؤها باستخدام ستاتا مع 
نظام تشغيل معين يمكن استخدامها مع نظام تشغيل آخر. التنسيقات المختلفة 
sd‏ تامج ستاتا - التي تظهر باختلاف نظام التشغيل - عبارة عن اختلاف 
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سس مح 
ستاتا ما هو متعارف عليه في كل نظام التشغيل» مشل تحديد المجلد 
\directory\filename‏ في ظل تشغيل ويندوز» وعلى العكس من ذلك» فإن 
المجلد في ظل نظام يونيكس يتم تحديده t/directory/filename‏ وبدلا من 
استخدام عرض لأنظمة التشغيل الثلاثةء فقد قمت باس تخدام نظام تشغيل 
ويندوز. وبالنسبة لمستخدمي أنظمة التشغيل الأخرى» فسوف يحتاجون للقيام 

المؤلف 


ملاحظات المؤلف على الطبعة الشامفة 








بدأت في استخدام برنامج ستاتا سنة 1985« وهي أول سنة يتم فيها 
إطلاق هذا البرنامج. ومبدئياً فإن برنامج ستاتا كان يعمل على نظام تشغيل 
MS-DOS‏ فقطء ولكن الاتجاه نحو استخدام إصدار مع أجهزة الكمبيوتر 
الشخصيء جعل البرنامج يبدو أكثر حداثة من منافسيه الذين ظهروا قبل ثورة 
الكمبيوتر. حيث كانت هناك كروت مثقبة كبيرة مع 80 عمودا تعمل في بيئة 
الفورتران. وعلى خلاف الاتجاه العام في البرامج الإحصائية التي تعتبر 
مستخدم عبارة عن حزمة من الكروت» فإن برنامج ستاتا نظر إلى التعامل 
مع المستخدم كنوع من المحادثة» فطبيعة تفاعله وتكامله مع العمليات 
الإحصائية لإدارة البيانات» والأشكال البيانية تدعم التدفق الطبيعي للتفكير 
التحليلي بعدة طرق» لم تستطع البرامج الأخرى القيام بها. فالأمر «graph‏ 
والأمر «predict‏ أصبحا من EPI‏ المفضلة لدى ad c ASI‏ أعجبني LAS‏ 
كيف أن كلها تتناسب معاً. وبدأت كتابة أول كتاب عن ستاتا بعنوان 
"الإحصاء مع ستاتا" والذي ^y‏ سنة 1989 لإصدار ستاتا 2. والذكرى 
العشرون لبرنامج ستاتا في سنة 2005 كانت متميزة بنشر إصدار خاص من 
مجلة ستاتا Stata Journal‏ يحتوي على مجموعة مقالات تاريخية» ومقابلات» 
وملخص تاريخي عن كتاب "الإحصاء مع ستاتا". 

ستاتا تغير بقدر كبير جداً Ma‏ صدور الطبعة الأول للكتاب» حيث 
لاحظت أن ستاتا ليس برنامجاً للقيام JS‏ شيء» ولكن الأشياء التي يقوم بها 
يتم إنجازها بشكل رائع. التوسع الكبير في قدرات ستاتا گان Aaa‏ وهذا 
a qualis‏ في التكاثئر» ولاحقاً في التبرير المنطقفي لإجراءات صياغة 
النماذج. فأسلوب بناء وليام جولد لبرنامج ستاتاء والذي يشمل أدوات ستاتا 
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فب وصيغ أوامره نصيّة تم تقديمها بشكل جيد» وتم دمج طرق إحصائية 

يدة خلال تطويرهاء وهناك تشكيلة كبيرة من الرسومات البيانية في الفصل 
)3 3) وفي الفصل (8) حيث تمت تمت مناقشة عدد كبير من أوامر صياغة النماذج. 

وفي الفصول اللاحقة تم مناقشة السلاسل الزمنية الجديدة وقدرات 
النماذج المختلطة»؛ ونماذج التعويض المتعددة. وهذا النقاش يوضح مدى 
التطور الكبير في برنامج ستاتا خلال السنوات الماضيةء كما توجد هناك 
مساحات للتقنيات الجديدة مثل تلك المتعلقة بالبيانات الطولية (xt)‏ والبيانات 
الاستقصائية (597)» وبيانات السلاسل الزمنية «(ts)‏ وزمن البقاء (st)‏ 
والإسناد المتعدد .(mi)‏ هذه المساحات تفتح alle‏ الاحتمالات» كما تفعل 
الأو امر البرمجية للنماذج الخطية العامة (gim)‏ أو الإجراءات العامة لتقدير 
الأرجحية العظمى؛ التطور الرئيس الآخر يتضمن تطور قدرات برمجة 
المصفوفات» والزيادة بإضافة مميزات جديدة في إدارة البيانات والأدوات 
التحليلية متعددة الأغراض» مثل الرسومات البيانية الهامشية أو صياغة 
المعادلة الهيكلية» وإدارة البيانات تم تطويرها من موضوع بسيط في أول 
طبعة لكتاب الإحصاء مع ستاتا إلى فصل كامل في الطبعة الثامنة. 

القائمة الشاملة لبرنامج ستاتاء ونظام مربعات الحوار» تعتبر طريقة 
بديلة للأوامر التي تتم طباعتها. حيث يمكن الاختيار والنقر على أي أمرء 
القوائم المنسدلة واختيارات ومربعات الحوار يمكن تعلمها بسهولة من خلال 
الاكتشاف Vay‏ من القراءة. وعموماً فإن كتاب "الإحصاء مع "Ulis‏ يعطي 
تلميحات عامة عن القوائم في بداية كل فصل. في أغلب أجزاء هذا الكتابء 
Lid‏ باستخدام الأوامر» وذلك لتوضيح ما يمكن لبرنامج ستاتا عمله» ونظائر 
الأوامر الموجودة بالقوائم يمكن التعرف عليها بسهولة» وعلى العكس من 
ذلك» فإذا بدأت ألعمل من خلال القوائم» فإن ستاتا يوفر تدريباً غير رسمي 
من خلال عرض الأمر ذات العلاقة في نافذة النتائج؛ حيث إن القوائم 
ومربعات الحوار تعمل على ترجمة النقر إلى أوامز ستاتاء والتي يتم تنفيذها 
ببرنامج ستاتا. 


ملاحظات المؤلف على الطابعة الثامنة 21 
ا YY‏ 


الرسومات البيانية التحليلية تعتبر إحدى نقاط القوة المتميزة ببرنامج 
ستاتاء كما هو واضح في كل فصل من هذا الكتاب. فالعديد من الأمثلة ليست 
Hy gue‏ بذائية تقوم بتوضيح تقنية معينة» ولكنها تقؤم بتجسيد بعض التحسينات 
الغرض النشر أو-تطوير جودة العرض: قد يقوم القارئ بتصفح هذه الأشكال 
البيانية للتعرف: علئ بعض الأفكار حول الأشكال البيانية المحتملة» والتي قد 
لا تعرزضها أدلة استخدام بزنامج ستاتا. 
الإحصاء مع ستاتا (الإصدار 12) يختلف جوهرياً عن سابقه - وهو 
cus‏ (الإصداز 0) حيث تم إعادة تنظيم الفصول» وتم تضمين فصل جديد 
وهو عبارة عن مقدمة لبيانات الدراسات الاستقصائية» والذي يأتي في بدايات 
الكتاب؛ كما تم تناول مواضيع الانحدار في أربعة فصول في كتاب الإصدار 
0 تم leai‏ وتنظيمها بطريقة أكثر منطقية في فصلين» الأول: عن الانحدار 
| الخطيء أما الثاني: عن طرق الانحدار المتقدمة. فصل الانحدار المتقدم 
يحتوي على أجزاء جديدة عن الإسناد المتعدد للقيم da gia‏ وعن نماذج 
المعاذلة الهيكلية ul (SEM)‏ فصل تحليل المكونات الأساسيةء والتحليل 
“الغامليء والتحليل العنقودي» cue ja haf yai‏ جدذيدين يعرضان استخدام 
العلامات العامليّة في الانحدارء و انكام قياس النماذج في «SEM‏ الجزء 
الجديد في فصل صياغة نماذج التأثيرات المختلطة:؛ وذات RUN‏ 
المتعددة: Ye yey‏ تجربة Ld Stal ull‏ الفصضل .الأخير؛ فهو عن 
Ante pull‏ وتم تبسيظه وتركيزة Usa‏ مثال رئيس (يقوم برسم أشكال بيانية 
fe realen‏ مقي لحك ارا 
axi‏ أهداف إصدار ومراجعة كتاب الإصدار 2 هو ABA! 2. 1i‏ 
فبعضها كان من بحوثي من فترة التسعينيات» ولكن مازالت مفيدة» فتحليل 
مكوك الفضاء تشالينجر - والذي تم استخدامه في إصدار سنة 1989 من هذا 
الكتاب والإصدار ات اللاحقة - مازال مفيدا لعرض الأفكار الأساسية في 
بداية فصل الانحدار اللوغاريتمي؛ هذا الفصل ينتهي مع التحليل اللوغاريتمي 
متعدد الحدود للردود على استطلاع سنة 2011( الذي يقوم بالاستفسار عن 
ماذا يعرف الناس؟ وماذا يعتقدون بخصوص التغير المناخيء الاستطلاع 
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الخاص بالتغير المناحي هو واحد من ثلاثة بيانات استطلاعية جديدة لسنة 
0 وسنة 2011. وهذه البيانات تم استخدامها في عدة أمثلة في فصول 
مختلفةء asi‏ هذه الفصول (تحليل المكونات الرئيسة والتحليل العاملي) يبدأ مع 
بيانات مبسطة خاصة بالكواكب؛ ولكن ينتهي بجزء جديد يدمج التحليل 
العاملي مع الانحدارء وقياسات مناظرة» ونماذج المعادلة الهيكلية مستخدماً 
بيانات استطلاع عن البيئة الساحلية لسنة 2011؛ الأمثلة الأخرى تتضمن 
سلاسل زمنية للمتغيرات التنبؤية للمناخ نفسه. وأحد البيانات المتميزة تتعلق 
ب 42 قرية في آلاسكاء وتم الحصول على هذه البيانات من دراسة في Aia‏ 
2011 وهي توضح كيف أن صياغة نماذج التأثيرات المختلطة يمكن أن 
تدمج العلوم التطبيقية مع بيانات العلوم الاجتماعية. ونماذج ARMAX‏ تختتم 
فصل السلاسل الزمنية والتي شور کا Lads dg‏ أجريت في ا 
1 اختبرت "الإشارة الحقيقية" للاحتباس الحراري» وحيثما أمكن فقد 
حاولت أن تكون الأمثلة تطرح أسئلة بحثية حول قضايا عامة بدلاً من عرض 
أرقام لتوضح طريقة التحليل. كما أن العديد من بيانات الأمثلة تتضمن 
متغيرات أخرى تتجاوز ما تم مناقشته في هذا الكتاب» وهي تمشل دعوة 
ob of al‏ يقوموا بتحليلات أكثر خاصة بهم. 

LS;‏ لاحظنا في الفصل )1( فإن أدوات المساعدة والبحث في ستاتا تم 
تطويرها لتحافظ على السرعة مع البرنامج» وبالإضافة إلى وشائق ستاتا 
المتوافرة من خلال ملفات المساعدة» توجد هناك صفحة إنترنت خاصة 
ببرنامج ستاتاء وإمكانية البحث في الوثائق الموجودة بتلك الصفحة. كما يوجد 
هناك منتدى المستخدمين» وتوجد هناك برامج تدريبية في «NetCourses‏ 
ومجلة ستاتا Stata Journal‏ وهناك ASÍ‏ من 9,000 صفحة من (SL gll‏ 
فكتاب ' الإحصاء مع ستاتا " يعتبر بوابة عبور لبرنامج ستاتا. فكل هذه 
المصادر التي تم ذكرها سوف تكون مصادر لمساعدتك. 


مقدمة المترجم 





الحمد لله والصلاة والسلام على رسول الله» وعلى آله وصحبه أجمعين. 
الحمد لله الذي وفقني لإتمام ترجمة هذا alld «USI‏ الحمد والمنة على ذلك. 
هذا الكتاب هو محاولة aul‏ النقص الملحوظ في المراجع العربية التي تتناول 
بالشرح والتحليل كيفية استخدام برنامج ستاتا في التحليل الإحصائي. فهذا 
البرنامج له قدرات هائلة تخفى عن الكثيرين. وهذا الكتاب هو بمثابة دليل 
استخدام مبدئي لبرنامج ستاتا. فمن الصعب الإلمام بكافة قدرات هذا البرنامج 
وإمكاناته الضخمة في كتاب واحد. 

قبل الولوج إلى دفات كتاب "الإحصاء مع برنامج ستاتا" أنصح القارئ 
الكريم بأن يتجه مباشرة للموضوعات ذات الصلة بدراسته واهتماماته» مع 
ملاحظة ضرورة الاطلاع على الفصول الثلاثة الأولى؛ حيث تناول Jail‏ 
الأول: لمحة سريعة عن الكتاب» وما تعنيه تنسيقات الخطوط المستخدمة. LÍ‏ 
Quail‏ الثاني: فقد تطرق إلى كيفية إدخال البيانات لبرنامج ستاتاء وكيفية 
استيرادها من البرامج الأخرى» وإدخالها لبرنامج ستاتاء وكذلك نوه إلى أنواع 
المتغيرات» وأنواع العينات. أما الفصل الثالث: فهو بمثابة معرّض لأشكال 
الرسومات البيانية» حيث شرح بنوع من التفصيل أوامر إنشاء الرسومات 
البيانية وأنواعها وطرق تحريرها وتعديلهاء كما تناول كذلك كيفية دمج أكثر 
من شكل بياني في شكل واحد. 

بقية فصول الكتاب — وهي عشرة فصول - فقد Cu gli‏ موضوعات 
تحليلية مستقلة بذاتهاء فيمكن للقارئ الانتقال إلى الفصل الذي يتعلق بمجال 
بحثه» وفي حالة الحاجة إلى أي معلومة من الفصول السابقةء فقد تم الإشارة 
إلى الجزء الذي يجب على القارئ الانتقال إليه مباشرة في الفصول السابقة؛ 
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Quail Li‏ الأخير - وهو الفصل الرابع عشر - فيعتبر مقدمة عن كيفية 
إنشاء أوامر ببرنامج ستاتا. وهذه الميزة لا توجد في العديد من برامج الحزم 
الإحصائية Ads all‏ حيث يمكن للقارئ تصميم أوامر لأساليب إحصائية 
جديدة - وهذا الأمر متقدم جا 9 إد SETS‏ يانات معينة» وجعل هذه 
الأوامر متاحة لجميع المستخذمين في العالم ليقوموا بتحميلها واستخدامها. 

ختاماء لا يفوتني أن أتقدم Galle)‏ شكري uiid y‏ لكن من ساهم في 
إخراج هذا الكتاب إلى Sie‏ الوجوذء وأخص بالذكر coal‏ فالكلمات تغجز 
عن التعبير عن مدى.امتناني لهماء كما أتقدم بشكزي الجزيئل لإخنوتي 
وأصدقائي الأعزاء le‏ تشجيغيم nears‏ المستم على إتمام هذا العمل» كما 
أتقدم بشكري وامتناني لأسناتذتي الأفاضل» وأخطن بالذكر أستاذي الفاضل 
وصديقي العزيز الدكتور sled‏ أحمد cxlo‏ فهو مثال للعطاء وقدوة في 
البذل بإخلاصء لقد كان لدعمه وتشجيعه لي خلال فثرة دراستي بمرخلتي. 
الماجستير والدكتوراه الأثر الكبير في تطوير «holes‏ كما أتقدم SSL‏ 
لجميع العاملين بدار المريخ (cle‏ مجهوداتهم وتعاونهم الكبير ui‏ إخراج هذا 
الكتاب بالصورة المطلوبة. daala aeta Mad r‏ لله أن يجعل 
هذا الكتاب i Lle‏ به 


i مفتاح الفيتوري‎ uma). ١ 
كلية الاقتصاد - جامعة غمر المختار- ليبيا‎ ٠ 


تنويه: 





لتطبيق الأمثلة الواردة في.هذا إلكتاب» فأنت تحتاج إلى تحميل 
ملفات البيانات الخاصة بالأمثلة» ويمكنك الحصول عليها من الرابط 
التالى: ْ 1 http://www.stata.com/bookstore/swsdl.html‏ . 





- المترجم 


(لنسل Cah)‏ .. 
ستاتا nutem‏ البيانات ' 


Stata and Stata Resources. 








atis as] ra ore $us s‏ لأجهزة الكمبيؤئز التي تعمل 
باستخدام نظم التشغيل Windows‏ :“أو Mac‏ أو بون ل کیٹ : .إنه يمتاز بالسهولة 
والسرعة في الاستخدآم» وهو عبارة:عن مكتبة لها القذرة cle‏ إدارة البيانات 
واستخدام qual osi‏ التحليلية Ciga bacali‏ والقدرزة على Asa ll‏ التي تتيح 
للمستخدمين اختراع وإضافة قدرات أكثر حسب الحاجة. Cose‏ العمليات 
الإحصائية, fe‏ إنجان ها باستخدام القوائم Aus sali‏ أو etiki‏ الأو امر 
مباشرة. كما afl gill cj‏ تساعد المستخدمين الجدد لبرنامج ستاتا عل ai‏ 
Gil Area‏ تساعد على تطبيق الإجراءات غير المعتادة؛ إن اس تخدام 
أوامر ستاتا وكتابتها باستمرارتساعد الي ذوي الخبرة على القيام 
بأعمالهم بكفاءة c ASÍ‏ كما يجعل تطوير البرامج للاستخدامات المعقدة عملية 
سبهلة: Lol‏ استخدام القوائم cles PA‏ يمكن أن يتم خسب الحاجة أثناء 
استخدام ستاتا. كما أن المساعدة المكثفة الموجودة ببرنامج ستاتاء تمكنك من 
البحث ومغرفة الميزات التي تجعل ell cs‏ العثؤن على تركيبة الأمر 
و.المعلومات في.وقت قضير Jas.‏ هذا الكتاب تم إعداده كتكملة لميزات 
المساعدة الموجودة ببرنامج.ستاتا. i‏ 
بعد مقدمة مبسطةء سوف fas‏ بأمثلة عن Giu‏ لإعطائك لمحة عن 
تسلسل عملية تحليل البيانات» وكيفية استخدام النتائج الإحصائية. والفصول 
اللاحقة تشرح ذلك بشكل jd‏ تفصيلا. . حتى بدون شرح» يمكنك أن ترى 
كيف أن أوامر ستاتا واضحة, فمثلا use filename‏ هو أمر يُستخدم 
لفتح ملف بيانات Gl filename A aal‏ الأمر summarize‏ فيمكنك عن طريقه 
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الحصول قل correlate fg itd asl‏ للحصول جل مصفوفة 
الارتباط وهكذاء هذه النتائج AMEN‏ الحصول عليها باختيارها من قوائم 
Data‏ أو .Statistics‏ 
Lag‏ ستاتا لديهم ع عدد د كبير من المصادر التي apin‏ على p‏ 
تعرض el os‏ هذا am‏ المصادر الرئيسة Fe‏ على aea‏ وطباعة 
دليل الاستخدام» وأين يمكنك إرسال بريد إلكتروني للحصول على المساعدة 
التقنية من صفحة ستاتا www.stata.com‏ 9_ التي توفر الكثير من الخدمات بما 
فيها التحديثات» وجزء عن الأسئلة المتكررة» وقائمة ستاتا على الإنترنت» 
ومجلة Aus adi Blt‏ 
ملا حظان حول ننسيعات الطباعة : A Typographical Note‏ 
هذا الكتاب يستخدم مجموعة من التنسيقات التي توضح كيفية اس تخدام 
الكلمات: 
d i -‏ الكل aal,‏ لياه اممك كن ينقط aged‏ تسو PE pigs‏ 
كتابة سطر أمر بالكامل؛ فإنه يبدأ بمسافةء كما يظهر في نتائج ستاتا أو 
ملف سجل المخرجات. 
.correlate extent area volume temp‏ 
- أسماء المتغيرات والملفات الموجودة في أي أمر تظهر بخط مائل للتأكيد 
Leal ule‏ ليست جنع من الأمن ولكتها Al As d‏ 
- أسماء المتغيرات والملفات تظهر بخط مائل ضمن الأمر نفسه حتى تساعد 
على التفرقة بينها وبين الكلمات العادية. 
- العناصر التي تعبّر عن قوائم من شريط مهام ستاتا تظهر بخط من نوع 
Arial‏ يليها الخيارات ويفصل بينها علامة "<". فعلى سبيل المثالء يمكننا 
فتح ملف بيانات باستخدام القائمة «File > Open‏ وبعد ذلك يتم تحديد 
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الملف المطلوب والنقر عليه؛ وهناك العديد من المهام التي يمكن إنجازها 
باستخدام القوائم الموجودة في أعلى نافذة ستاتا. 
File Edit Data Graphics Statistics User Window Help‏ 
أو استخدام صف الأيقونات الموجودة أسفل هذه القوائم» فمكلاً ود 
اختيار القائمة File > Open‏ يُعادل النقر على الأيقونة الموجودة أقصى 
اليسارء وهي تشبه المجلد المفتوح» نفس الشيء يمكن القيام به بطباعة أمر 
على الشكل التالي: 





.use filename 


وهكذا يمكننا عرض ملخص إحصائي للمتغير extent‏ كما يلي : 


summarize extent 


Variable Obs Mean Std. Dev. Min Max 


extent 33 6.51697 .9691796 4.3 7.88 


نفسه» وستاتا له القدرة على عرض أنواع متعددة من الخطوط على الشاشة» 
ولكنه لا يستخدم الخط المائل في أوامر ستاتاء فعندما يقوم برنامج ستاتا 
باستخدام ملفات معينة تم استيرادها من برنامج نصي آخر أو جدول نتائج تم 
نسخه ولصقهء يمكنك تغيير تنسيق هذه الملفات إلى نوع الخط Courier‏ وحجم 
10 أو c Xl‏ وبذلك فإن أعمدة البيانات سوف تظهر بصورة منظمة 
وواضحة. 

ستاتا برنامج حساس لحالة أحرف المتغيرات» حيث إن الحرف الصغير 
يختلف عن الحرف «ll‏ « ولذا فإن summarize‏ يعتبر yd‏ ولكن 
SUMMARIZE 5 Summarize‏ لا تعتبر أوامرء كذلك extent g Extent O‏ سوف 
يتم اعتبارهما متغيرين مختلفين. 


28 الإخصاء مع برئامج ستاتا 
مثال على استخدام An Example Stata Session : Uus‏ 


كنظرة ة عامة على كيفية استخدام ستاتاء هذا الجزء سوف يشرح استخدام 
وتحليل بيانات تم إعدادها مسبقاً Cala‏ اسمه cArctic9.dta"‏ وهي عبارة عن 
EE ce ee ae irit sand‏ الصناعية في الفقترة )1979 إلى , 
1) فهي مشاهدات عن الجليد في المحيط المتجمد الشمالي خلال شهر 
ea‏ من od, cal des.‏ البيانات ثم الحصول عليها من E‏ 
مصادر مختلفة (انظر Gi yall‏ الخاص بمصادر البيانات في نهاية هذا ٠‏ 
الكتاب): المتغير الأول extent‏ وهو قياس يعتمد على صور القمر الصناعي 
للمنطقة البحزية في نصق SU‏ الشمالي والتي تخثوي على تسبة 9615 
على الأقل من الخليد كل شه سبتمبر Area‏ وهي أرقام dal‏ من extent‏ تمثل 
المنطقة المتجمدة نفسهاء متغير آخر وهو tempN‏ يوضمح متوسط درجة 
الحرارة السنوية ol gel‏ سطح البحر بالمنظقة التي تقع أعلى من 64# شمال” 
خط الاستواء» ودرجات الحرارة تم التعبير عنها بدرجات الحرارة الشاذة 
وهي تلك المكتوبة بطريقة مختلفة» بخيث إنها توضخ CR RA‏ عن lia‏ 
ترج الخو Ph áo‏ تا به 
(سنوات) و 8 متغيرات. : E‏ 

نحن cuti uu)‏ في AI AR‏ إلى تسجيل خط وات هذه A quel‏ 
وأفضل طريقة للقيام بذلك تتم بواسطة فتح ملف تسجيل في بداية cle‏ حيث 
إن ملف التسجيل يختوي على الأواهرء وجداول النتائج» ولكن لا يحتوي على 
الرسومات البيانية. وللبدء بفتح ملف تسجيل قم بختيار File > Log > Begin‏ 
من شريط القوائم» ثم قم باختيار اسم الملف .والمجلد:الذي. تريد أن: تحفظ فيه 
ملف تسجيل النتائج» أو يمكنك طباعة أمر مباشر .كما يلي : 

¿log using Mondayi b > ١ 

هناك عدة طرق للقيام بالأشياء الأكثر استخداما :يغ Aa JS ian‏ : 

jected مخطفة‎ p b d enn d aab لها مز اها‎ 


www.stata.com البيانات الخاصة بهذا الكتاب يمكن الحصول عليها من موقع‎ j 
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ملفات التسجيل يمكن إنشاؤها في ستاتا dab‏ خاص «(.smel)‏ 3 
كملفات نصية عادية 3 بتنسيق (log) ASCII‏ امتداد .smcl.‏ (لغة ستاتا في 
الاستعادة والتحكم) سوف تكون مناسبة للمعاينة والطباعة باستخدام برنامج 
ستاتاء كما يمكن Cad‏ أن A‏ ,يراع gt‏ اقيم SA‏ 
ورسائل الخطأء والتي Y‏ يمكن أن م D mm‏ 
الملفات النصية لها نفس الاستخدامات إذا كنت تريد التخطيط لاحقاً لإدراج 
تحرير نتائج في برنامج alles‏ النصوص Word‏ بعد اختيار مايه 
التسجيل تحتاج tel‏ حفظ الملف بواسطة hual‏ على Save‏ في هذا 
التمرين» سوف نقوم باستخدام ملف تسجيل -Mondayl.smcl pul smel £o‏ 

سوف يتم تحليل بيانات الملف المسمى Arctic9.dta‏ ولفتح الملف 
واستخراج بياناته» هناك عدة خيارات» من قائمة المهام اختر منها < File‏ 
Open >Arctic9.dta‏ 

أو اضغط على Ft‏ نة فتح j‏ ثم Arctic9.dta‏ 

أو قم بطباعة الأمر: 

.use Arctic9.dta 

الإعدادات الافتراضية في نظام التشغيل ويندوز تجعل ستاتا يبحث عن 
ملفات البيانات في مجلد المستندات الخاصة بالمستخدمء وإذا كنا نريد ملفا في 
مجلد مختلف» فإنه يجب علينا تحديد موقع الملف عند استخدام use yd‏ 

.use C:\books\sws_12\data\Arctic9 
cd أو يمكنك تغيير المجلد الافتراضي وذلك باستخدام الأمر‎ 
.cd C:\books\sws_12\data\ 
.use Arctic9 

» قم باختيار ... File »Change Working Directory‏ من «ell ill‏ 
وفي الغالب فإن أسهل طريقة لفتح ملف البيانات هي File > Open‏ ثم تحديد 
المجلد بالطريقة المعتادة. 

لمشاهدة وصف مختصر للبيانات قم بطباعة الأمر: 


.describe 
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Se 


Contains data from C:\data\Arctic9.dta 


obs: 33 Arctic September mean sea ice 1979-2011 
vars: 8 2 Jul 2012 06:11 
size: 891 
سسس‎ 
storage display value 
variable name type format label variable label 
year int Sty Year 
month byte 58.09 Month 
extent float 59.09 Sea ice extent, million km^2 
area float $9.0g Sea ice area, million km^2 
volume float %8.0g Sea ice volume, 1000 km^3 
volumehi flcat %9.0g Volume * 1.35 (uncertainty) 
volumelo float 59.09 Volume - 1.35 (uncertainty) 
tempN float %9.09 Annual air temp anomaly 64N-90N C 


Sorted by: year 


العديد من أوامر ستاتا يمكن اختصارها باستخدام حروفها الأولى؛ فمثلاً 
يمكننا اختصار describe‏ لتكون là‏ الحرف «d‏ باستخدام all sill‏ يمكن 
الحصول على نفس الجدول بختيار الأمر: 

Data»Describe Data » Describe data in memory » (OK). 

البيانات الموجودة لدينا تحتوي على 33 مشاهدة و8 متغيرات. لذا يمكتنا 
وضع قائمة US‏ محتوياتها بطباعة الأمر list‏ (أو الحرف 1ء أو اختيار 
«(Data>Describe Data > List data > (OK)‏ للاختصار فقط سوف 
نعرض أول عشر سنوات بطباعة الأمر: 


.list in 1/10 


year month extent area volume volumehi volumelo tempN 
ls .9095 18.2595 15.5595 
2. .3194 17.66937 14.96937 
3. .8131 14.16307 11.46307 
4. .5099 14.85987 12.15987 
$5 «2013 16.5513 13.8513 
6. 14.6336 15.98357 13.28357 
F 14.5836 1528 13.23363 
8. 16.0803 17.43027 14.73027 
94 15.3609 16.7109 14.0109 
0. 14.988 16.338 13.638 
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التحليل يمكن أن يبدأ بجدول به المتوسط الحسابي والانحراف المعياري» 
وأعلى قيمة وأصغر قيمة» بطباعة الأمر summarize‏ أو ‘su‏ 4 قم 
باختيار ذلك من القائمة 


Statistics>Summaries, tables, and tests > Summary and 
descriptive statistics » Summary statistics (OK) 


. summarize 










Variable 





1995 9.66954 
33 9 0 9 9 
33 6.51697 .9691796 4.3 7.88 
33 4.850303 .8468452 3.09 6.02 
12.04664 3.346079 4.210367 


month 
extent 
area 








13.39664 3.346079 5.560367 
volumelo 33 10.69664 3.346079 2.860367 15:5595 
tempN 33 . 790303 31157928 -7 2.22 


لطباعة نتائج هذا التحليل اضغط على نافذة النتائج ثم اضغط © أو من 
القوائم اختر File>Print > Results‏ 


لنسخ الجداول والأوامر أو أي معلومات أخرى من نافذة النتائج في أي 
alles‏ نصوصء قم باستخدام الفارة لتحديد النتائج المراد نسخها ثم اضغط 
الزر الأيمن للفارة واختر Copy Text‏ من القائمة المختصرةء ثم بعد ذلك 
انتقل إلى معالج النصوصء واختر المكان المراد إدراج البيانات بهء ثم 
اضغط على الزر الأيمن للفارة واختر Paste‏ أو اضغط على أيقونة لصق 
في برنامج معالج النصوص Microsoft Word‏ الخطوة الأخيرة في أغلب. 
الحالات هي تعديل النص الذي تم لصقه ليكون بحجم الخط المطلوب. 

مستوى جليد البحر extent‏ 9 حجمة volume‏ في شمال الكرة الأرضية area‏ 
يفترض أن يرتبط بدرجة حرارة الهواء السنوية crempn‏ ليس فقط el sell GY‏ 
الساخن يساعد في الذوبان» ولكن أيضاً لأن درجة الهواء فوق سطح الجليد 
سوف تكون ASÍ‏ دفئا من الجليد نفسه؛ يمكننا مشاهدة الارتباط بين هذه 
المتغيرات بطباعة الأمر correlate‏ يليه قائمة بالمتغيرات 


-correlate extent area volume tempN 
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(0bsz33) 
extent area volume tempN 
extent 1.0000 
area 0.9826 1.0000 
volume 0.9308 0.9450 1.0000 
tempN -0.8045 -0.8180 -0.8651 1.0000 


النتائج توضح أن هناك ارتباطاً إيجابياً قوياً بين مستوى جليد البحر 
vos viime aoc eden‏ الكل 5 الأ caters Sato‏ وده و رطا كام dada‏ 
وام OSS eid‏ سلبى مع Sagi‏ الحرارة ۸وت kp‏ بعتي أن 
درجة حرارة الهواء تؤدي إلى نقص في الجليد والعكس صحيح. 

مصفوفة الارتباط code‏ يمكن الحصول عليها كذلك باستخدام pil ill‏ كما 


Statistics>Summaries, tables, and tests > Summary and 
descriptive statistics >Correlation and covariance 


ثم قم باختيار المتغيرات التي تريد قياس ارتباطها. 

بالرغم من أن استخدام القوائم سهل وواضح. فإنها أكثر تعقيداً من 
طباعة الأوامر» Sling‏ على calls‏ فإننا سوف نركز بشكل أساسي على طباعة 
الأوامرء وفي نفس الوقت سوف نشير إلى القوائم بشكل عرضي. أما 
اكتشاف كيفية استخدام القوائم» وكيفية القيام باستخراج النتائج عن طريق هذه 
القوائم فسوف نتركه للقارئ. والسبب الآخر في اس تخدام طريقة طباعة 
الأوامرء هو أن دليل استخدام ستاتا يستخدم طريقة الأوامر للشرح 
والتوضيح. 

إذن فهناك ارتباط بين مستوى جليد البحر extent‏ وحجمه volume‏ في 
شمال الكرة الأرضية area‏ ودرجة الحرارة ctempn‏ كيف تأثرت هذه 
المتغيرات خلال فترة من الزمن؟ الرسم البياني (1.1) والذي تم الحصول 
عليه بالأمر graph twoway connect‏ يوضح مستوى الجليد خلال سنوات 
الدراسة crear‏ المتغير الذي يتم إدخاله أولا في هذا الأمر هو مستوى جليد 
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extent pail‏ سوف يظهر على المحور العمودي أو محور y‏ بينما المتغير 
الذي يتم allay‏ أخيراً فسوف يظهر على المحور الأفقي year‏ أو محور ox‏ 
ویمکنتا أن نرى من الشكل أن هناك انخفاضاً كبيرًا في المنحنى» حيث إن 
حجم الجليد خلال شهر سبثمبر انقفض بأكثر من CBN‏ خلال المدة. 
graph twoway connect extentyear‏ 


o- 


7 
کے 


Sea ice extent, million km^2 
6 
E a 


5 
— NÓ 
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T SSS 
1980 1990 2000 2010 
Year 
(1.1) الشكل‎ 


لطباعة الرسم البياني» اذهب إلى نافذة الرسم البياني» واضغط على 
أيقونة الطباعة أو س اختر «File > Print‏ ولنسخ الرسم البياني داخل معالج 
النصوص اضغط زر الفارة الأيمن على الرسم البياني ثم اختر Copy‏ بعد ذلك 
انتقل إلى معالج النتصوص وحدد المكان الذي تريد أن تقوم بإدراج الرسم به 
واضغط أيقونة لصق أو اختر تحرير > لصق» أو تحرير > لصق خاص. 

لحفظ الرسم , البياني للاستخدام مستقبلاً اضغط زر الفارة الأيمن واختر 
Save as‏ 9 اضغط أيقونة d‏ حفظ في نافذة الرسم البياني» أو اختر > File‏ 
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Save‏ ومن قائمة Save as type‏ هناك مجموعة تنسيقات مختلفة لنوع 

الملف» في نافذة الحفظ هناك عدة خيارات بامتدادات مختلفة» وهذه الخيارات 

تتضمن: 

Stata graph (*.gph)‏ وهذا النوع يحتوي على معلومات كافية ليتم 
تحرير الرسم باستخدام برنامج ستاتا. 

As-is graph (*.gph)‏ وهو نوع مضغوط من تنسيقات ستاتا. 

Windows Metafile (*.wmf) 

Enhanced Metafile (*.emf) 

Portable Network Graphics (*.png) 

TIFF (*.tif) 

PostScript (*.ps) 

Encapsulated PostScript with or without TIFF preview (*.eps) 

Portable Document File (*.pdf) 


أنظمة التشغيل الأخرى مثل ماك Mac‏ أو لينكس Linux‏ توفر مجموعة 
مختلفة من الخيارات لحفظ الرسم البياني» بغض النظر عن أي تنسيق تريده 
لحفظ الملف. من الأفضل أن يتم حفظ نسخة من الرسم البياني بامتداد gph‏ 
حيث يمكن مع هذا الامتداد فتح الملف لاحقاً باستخدام برنامج ستاتاء ودج 
الرسم وتغيير ألوانه وإعادة تنسيقه باس تخدام الأمر graph use‏ أو graph‏ 
combine‏ أو تحرير الرسم البياني باستخدام Graph Editor‏ (الفصل call‏ من 
هذا الكتاب). 
خلال كل مراحل التحليل في هذا الكتاب» ملف التسجيل Mondayl.smel‏ 
سوف يقوم بحفظ النتائج» وأسهل طريقة لمعاينة ما تم حفظه في هذا cà ll‏ 
يتم بفتح الملف باستخدام نافذة المعاينة» ويكون ذلك باختيار: 
File>Log > View > OK‏ 
ويمكننا طباعة محتويات ملف t]‏ التسجيل بالضغط على أيقونة 9 وهي 
في أعلى شريط المهام في نافذة المعاينةء وملفات التسجيل يتم إغلاقها تلقائياً 
عند DUE}‏ ستاتاء أو يتم ذلك قبل إغلاق ستاتا بالضغط على هذه الأيقونة 
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الموجودة فى أعلى شريط المهام في نافذة ستاتا واختر Close log file‏ أو 
يمكنك كتابة الأمر Log close‏ كما يمكن اختيار: 
File>Log > Close‏ 
عند إغلاق ملف التسجيل «Mondayl.smcel‏ يمكن إعادة فتحه ومثاهدة 
محتوياته من خلال File» Log > View‏ اضغط أيقونة | بعد اس تخدام 
ستاتا؛ ولإنشاء ملف مخرجات (Say‏ فتحه باستخدام أي alles‏ نصوص أو 
ترجمته من ملف التسجيل الذي ينتهي بامتداد sme!‏ (تنسيق ستاتا لملفات 
التسجيل) إلى og‏ (الصيغة العامة للملف النصي (ASCII‏ قم بطباعة الأمر 
التالي : 
.translate Mondayl.smcl Monday1 . log‏ 
أو يمكنك البدء بإنشاء ملف تسجيل بامتداد dog‏ بدلاً من smel‏ كما يمكنك 
Cad‏ البدء والتوقف مؤقتاً في استعمال ملف التسجيل في أي لحظة باختيار: 
File>Log > Suspend‏ 
File>Log > Resume‏ 
وأيقونة التسجيل C].‏ الموجودة في شريط مهام ستاتاء يمكنها أيضًا القيام 
بكل هذه المهام. 
اطسنندات واطلفات أمساعدة Vo ĉwl‏ : 
Stata's Documentation and Help Files‏ 
دليل استخدام ستاتا 12 يتضمن 9 مجلدًا: دليل صغير aanl‏ عن بدء 
استخدام ستاتا Getting Started‏ (مثلاً: eau‏ باستخدام ستاتا مع ويندوز T‏ « ودليل 
أكثر تركينا وهو دليل المستخدم User's. Guide‏ الذي يتكون من أربعة مجلدات 
شاملة تمثل lap ya‏ شاملا «Base. Reference Manual‏ ويحتوي على شرح عن 
إدارة البيانات» eG ga JM s‏ والبيانات AL gl)‏ وبرمجة المصفوفات 
والاستدلال المتعدد والبرمجة وصياغة نماذج المعادلات الهيكلية» وبيانات 
الاستبيانات؛ وجداول تحليل التعداد السكاني» وتحليل السلاسل الزمنية. كما 
أن دليل eas‏ استخدام ستاتا ele Lus Getting Started‏ على تثبيت برنامج 6a‏ 
وإدارة ويندوز» وإدخال البيانات» والطباعة.. call‏ ولكن دليل المستخدم User's‏ 
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Guide‏ يحتوي على نقاش تفصيلي عن المواضيع العامة بما فيها مصادر 
البيانات» وحل المشاكل في ستاتاء ويجب ملاحظة أن دليل المستخدم يحتوي 
على الأوامر التي يجب أن يعرفها كل مستخدم» أما دليل المرجع Base‏ 
اوم وقوه tia ang‏ قائمة .14 مانا digas dise‏ وإدخالات الأوامر 
التي تتضمن اسم الأمر بالكامل» وشرح لكل المتغيرات والخيارات» à d y‏ 
وملاحظات تقنية عن iatis fecal‏ المنطقية؛ وقائمة مراجع للحصول 
على معلومات gd‏ عن ستاتا؛ أما بخصوص إدارة البيانات والرسومات 
البيانية والبيانات الأخرىء فإنه تم تناولها في المراجع العامة. ولكن هذه 
المواضيع المعقدة تم تناولها بمزيد من التفاصيل والأمثلة في الكتب 
المتخصصة؛ وهناك Un‏ المرجع السريع والمؤشر A Quick Reference and‏ 
Index‏ الذي يحتوي على كل المواضيع التي تريد البحث عنها؛ بالرغم من أن 
الكتب التي تتحدث عن كيفية استخدام ستاتا موجودة بكثرة في أرفف 
المكتبات إلا أن Gai‏ إلكترونية متكاملة على شكل ملفات PDF‏ يمكن الوصول 
إليها ضمن برنامج ستاتا نفسه في أي وقت من خلال اختيار Help>PDF‏ 
Documentation‏ أو من خلال طباعة الأمر help‏ ثم طباعة اسم الأمر. 
عند القيام باستخدام ستاتاء فإنه من السهل الحصول على المساعدة 
وعرضها على الشاشة والتي بدورها يمكنها الاتصال مع أدلة اس تخدام 
ومراجع ستاتاء كما أن اختيار Help‏ من شريط المهام qe‏ إلى ظهور قائمة 
منسدلة تحتوي على العديد من الخيارات» والتي من ضمنها أوامر Stata‏ 
La «(Command‏ هو الجديد «What's new?‏ تحديثات «Online updates‏ 
».جلة ستاتا «Stata Journal‏ البرامج المكتوبة بواسطة المستخدم USET-‏ 
«written programs‏ ورابط للاتصال مباشرة بصفحة ستاتا على الإنترنت 
$www.stata.com‏ أختيار Search‏ يسمح لك كمستخدم بطباعة الكلمات التي 
تبحث laic‏ ضمن مستندات cStata's documentation Gu‏ كما يمكنك 
sl) Contents Jes‏ طباعة الأمر (help‏ والذي يتيح Ul‏ البحث والقيام 
ببعض المهام حسب تصنيفهاء الأمر help‏ يعتبر مفيدًا [or‏ عند استخدام 
اسم الأمر بعده Sud‏ طباعة help. correlate ye!‏ يعرض ET‏ عق yl‏ 
correlate‏ في نافذة معاينة» وهذه المساعدة تعرض لك اسم pay‏ 
وتركيبته وقائمة ALIS‏ بالخيارات المتاحة مع الأمرء كما أنها أيضًا gaai‏ 
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بعض ALS‏ ولكنها بدون شرح تفصيلي أو ملاحظات تقنية كما هو الأمر 
في أدلة استخدام ستاتاء والمساعدة التي يتم عرضها على الشاشة لها عدة 
مميزات عن تلك الموجودة بدليل استخدام ستاتاء حيث إن نافذة المعاينة تسمح 
لك بالبحث باستخدام الكلمات الرئيسة في الملفات الموجودة في صفحة ستاتا 
على الإنترنت» كما أن الروابط تنقلك مباشرة إلى الأوامر ذات العلاقةء 
إضافة إلى «Alls‏ فإن المساعدة على الشاشة قد تحتوي على بعض الملاحظات 
حول آخر التحديثات أو برامج ستاتا غير الرسميةء والتي يمكنك تحميلها من 
صفحة ستاتا أو من المستخدمين الآخرين لبرنامج ستاتا. 


Searching for Information : البحث عن اطعلومات”‎ 


عند اختيار Help < Search » Search documentation and‏ 
FAQs‏ يزودك بطريقة واضحة للبحث عن معلومات معينة في أدلة استخدام 
ستاتا أو في صفحة الأسئلة المتكررةء والصفحات الأخرى» كما يمكنك Laj‏ 
البحث مباشرة في مجلة ستاتا «Stata Journal‏ ونتائج البحث تظهر في نافذة 
تحتوي على روابط عند النقر على أي منها سوف dili‏ إلى معلومات أكثر. 


ويقوم الأمر search‏ بنفس المهام» وأحد الا تخدامات الخاصة للأمر 
search‏ هو البحث عن معلومات أكثر Secun‏ عن أمر معين لا يعمل كما 
يفترض» ولكن Yau‏ من ذلك يمكنك القيام بالنقر على الرقم الذي يظهر في 
رسالة الخطأ للحصول على هذه المعلومات. فعلى سبيل المثال table‏ هو أحد 
أوامر ستاتاء ولكنه يتطلب معلومات محددة عن ماذا نريد في الجدولء فإذا 
Lus‏ بطباعة أمر table‏ بذاته بدون أي شيء آخرء فإن ستاتا يعرض الرسالة 
الخطأ التالية "return code" r(100):‏ 

.table 


varlist required 
r(100); 





* كل معلومات الدعم الفني والمساعدة في برنامج ستاتا تعرض باللغة الإنجليزية. 
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عند النقر على :(100): فإنه سوف يتم نقلك إلى معلومات مفيدة» والتي 
يمكننا كذلك الحصول عليها بواسطة كتابة الأمر 100 search rc‏ أو طباعة help‏ 
search‏ للحصول على معلومات حول أي أمر لستاتا. 
شركة Stata Corp : Uu»‏ 

العنوان البريدي لشركة ستاتا هو: 





Stata Corp 
4905 Lakeway Drive 
College Station, TX 77845 USA 


وأرقام هواتف الشركة هي: 
من الولايات المتحدة 001-782-8272 (1-800-sTATAPC) Í‏ 


من كندا 001-782-8272 
باقي دول العالم 001-979-696-4600 
فاكس 001-979-696-4601 


لشراء أو الحصول على رخصة استعمال أو معلومات التحديث؛ يمكنك 
الاتصال بشركة ستاتا عن طريق البريد الإلكتروني: 

service@stata.com 

أو زيارة صفحة ستاتا على الإنترنت 

www.stata.com 

كما أن صفحة Ga‏ على الإنترنت» بها جزء خاص بالإعلام 
والإصدارات الصحفية» بما في ذلك المنشورات والبيانات التي تم استخدامها 
في أمثلة بعض الكتب. 

www.stata-press.com 

وهناك مجلة ستاتا المحكمة؛ والتي أصبحت مصدرًا مهما وموقعها 
www.stata-journal.com‏ 
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صفحة ستاتا الرئيسة www.stata.com‏ تزود المستخدم بمعلومات A Èa‏ 
حيث إنها تبدأ بصفحات تشرح بالتفصيل منتجات ستاتاء وكيفية شراء منتجات 
ستاتاء والعديد من طرق دعم العملاء مثل: 

FAQs‏ وهي أسئلة متكررة مع أجوبتها عن بعض المشكلات التي لا 
توجد في أدلة استخدام ستاتاء الأسئلة تتنوع من أسئلة مثل "كيف تستطيع 
تحويل ملفات التطبيقات الإحصائية الأخرى إلى تنسيق ملفات ستاتا؟ إلى 
أسئلة ذات طبيعة تقنية أكثر مثل "كيف يمكنك وضع بعض المحددات على 
قيمة صفر باستخدام الأمر heckman‏ مع "ml‏ 

التحديثات Updates‏ : أغلب إصدارات ستاتا المرخصة يمكن تحديثها 
مجاناً للمستخدمين» وهذا يوفر طريقة سريعة وبسيطة للحصول على أحدث 
cil y ghi‏ والإسالتماته. الح للاسدار الذي تقوم بامتكدافة» VaL‏ من 
الذهاب إلى صفحة ستاتا على الإنترنت» يمكنك التأكد ما إذا كانت هناك أي 
تحديثات جديدة لبرنامج ستاتا الذي تقوم باستخدامه عن طريق طباعة الأمر 

.update query 

الدعم الفني: بالإمكان الحصول على الدعم الفني بواسطة إرسال بريد 
إلكتروني إلى stech-support@stata.com‏ و الردود في العادة تكون مفيدة» ولكن 
قبل إرسال بريد الكتروني يُفترض أن تقوم بمحاولة البحث عن حل لأي 
مشكلة من خلال FAQs‏ الأسئلة المتكررة. 

التدريب: بالإمكان التسجيل في بعض الدورات التدريبية على الإنترنت 
لبعض المواضيع المتخصصة في ستاتا مثل مقدمة في ستاتاء مقدمة إلى 
برمجة ستاتاء أو برمجة ستاتا المتقدمة. 

أخبار ستاتا: تحتوي على معلومات حول مميزات البرنامج والدورات 
التدريبية وآخر القضايا الخاصة بمجلة ستاتا ومواضيع أخرى. 

المنشورات: هناك روابط عن مجلة ستاتاء ومستندات وأدلة اس تخدام 
ستاتاء وكذلك الكتب المعروضة للبيع عن ستاتاء وأحدث مراجع ستاتاء 
بالإضافة إلى برامج الدعم لمؤلفي كتب جديدة عن ستاتا؛ كما أن صفحة ستاتا 
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تستضيف منتدى خاصاً بالنقاش حول مجلة ستاتا وكتب ستاتاء وروابطها 
وهذه يمكن الاطلاع عليها من خلال الرابط التالي: 
blgo.stata.com‏ 
مستخدمو مواقع التواصل الاجتماعي ربما يجدون أنه من الممتع والمفيد 
متابعة ستاتا على تويتر www.twitter.com‏ أو اضغط معجب لصفحة ستاتا على 
الفيس بوك www.facebook.com‏ 


The Stata Journal : Ulu مجلة‎ 


منذ سنة 1991 وحتى سنة 2001ء كان هناك إصدار نصف شهري 
يسمى التقرير التقني لستاتا Stata Technical Bulletin‏ وتم استخدامه كوسيلة لنشر 
الأوامر الجديدة وتحديثات برنامج ستاتا للمستخدمين؛ وفي نهاية كل سنة يتم 
تجميع هذه التقارير ونشرها في كتاب يسمى إعادة طباعة التقارير التفنية 
Stata Technical Bulletin Reprints Gud‏ ويمكن شراء هذا الكتاب من شركة 
ستاتا مباشرة؛ ومع تطور ca AE‏ أصبح الاتصال بالمستخدمين a Fd‏ 
وملفات البرامج يمكن بسهولة تحميلها من الإنترنت من مصادر بعيدة 
وأصبح التقرير النصف الشهري المطبوع لا يفي بحاجات المستخدمين 
ومعدي البرامج» لذلك فقد تم تغيير التقرير التقني إلى شكل آخر أحدث. 

مجلة ستاتا The Stata Journal‏ والتي تم إصدارها لتفي بالحاجات المتزايدة 
للعدد المتزايد لمستخدمي ستاتا؛ مجلة ستاتا تشبه التقرير التقني من حيث إنها 
تحتوي على مقالات تشرح أوامرستاتا الجديدة» والإصدار غير الرسمي 
لبعض الأوامرء والتي تم إعدادها بواسطة العاملين في شركة ستاتا؛ التركيز 
الأساسي للمجلة ليس على الأوامر الجديدة فقطء وإنما Laf‏ على مقالات 
محكمة عن الإحصاءء ومراجعات للكتب» وملاحظات عن استخدام ستاتاء 
وعدد من الأعمدة المفيدة والتي منها عمود (Gli!‏ تتحدث" Speaking Stata‏ 
لكاتبه نيكولاس كوكس Nicholas J. Cox‏ حول الاستخدام الفعال للغة برامج 
ستاتاء فمجلة ستاتا هي للمستخدمين المبتدئين والمحترفين على حد cel yu‏ 
dl Std‏ توبات Ala‏ سذاتا في عددها الصادن في sis‏ 2012: 
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"A robust instrumental-variables estimator," R. Desbordes, V. Verardi 


“What do hypotheses do “nonparametric” two-group tests actually test?" R.M. 
Conroy 


“From resultsses to resultstables in Stata," R.B. Newson 
“Menu-driven X-12-ARIMA seasonal adjustment in Stata,” Q. Wang, N. Wu 


“Faster estimation of a discrete-time proportional hazards model with gamma 
frailty,’ M.G. Farnworth 


“Threshold regression for time-to-event analysis: The stthreg package,” T. Xiao, 
G.A. Whitmore, X. He, M.-L.T. Lee 


“Fitting nonparametric mixed logit models via expectation-maximization 
ng F aran 8 p 
algorithm," D. Pacifico 


"The S-estim tor of multivariate location and scatter in Stata," V. Verardi, A. 
McCathie 


"Using the margins command to estimate and interpret adjusted predications and 
marginal effects," R. Williams 


"Speaking Stata: Trnsforming the time axis," N.J. Cox 
ملاحظات وتعليقات‎ 
“Stata tip 108: On adding and constraining,” M.L. Buis 


"Stata tip 109: How to combined variables with missing values," P.A. Lachenbruch 
"Stata tip 110: How to get the optimal k-means cluster solution," A. Makles 


يتم إصدار مجلة ستاتا بشكل ربع سنويء والاشتراكات في هذه المجلة 
يمكن أن تتم بزيارة رابط المجلة LS cwww.stata-journal.com.‏ يحتوي الموقع 
على قائمة أرشيف تتضمن كل الأعداد السابقة من المجلة» والتي يمكنك 
شراءها 5S‏ على حدة كما يمكنك تحميل مقالات السنوات الثلاث الماضية 
aiy dila‏ إصدار عدد خاص من المجلة بمناسبة الذكرى العشرين (العدد 5 
المجلد 1 سنة 2005( احتوى العدد على مقالات حول تطوّر ستاتاء وكتاب 
حول ستتا بعنوان "تاريخ قصير للإحصاء مع A short history of "GG a‏ 
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بالإضافة إلى Abl‏ استخدام ستاتا التي تأتي مع البرنامج نفسه؛ هناك نمو 
كبير في عدد الكتب التي تشرح ستاتا واستخداماته وتقنيات التحليل باستخدام 
ستاتا. هذه الكتب تحتوي على مقدمة عامةء والتطبيقات المتعلقة به مكل 
العلوم الاجتماعية أوالاقتصاد القياسي» كما يركز على النصوص المتعلقة 
بتحليل الاستبيانات» وبيانات التجارب المعمليةء والمتغيرات المستقلة المصنفة 
ومواضيع أخرى. 
كما أن مكتبة بيع الكتب على صفحة ستاتا لديها قائمة حديثة مع شرح 
لمحتويات الكتب على الرابط التالي : 
http://www.stata.com/bookstore/‏ 
هذه المكتبة تزودك بمكان رئيس للتعرّف على أحدث الكتب المتعلقة 
ببرنامج ستاتا من مختلف ناشري هذه الكتب. فعلى سبيل المثال» هناك العديد 
من الكتب منها: 
A Gentle Introduction to Stata, A.C. Acock‏ 
Using Stata for Principles of Econometrics, L.C. Adkins, R.C. Hill‏ 
An Introduction to Modern Econometrics Using Stata, C.F. Baum‏ 
Applied Microeconometrics Using Stata, A.C. Cameron, P.K. Trivedi‏ 


Event History Analysis with Stata, H-P. Blossfeld, K. Golsch, G.Rohwer 


An Introduction to Survival Analysis Using Stata, M. Cleves, W. Gould, R. 
Gutierrez, Y. Marchenko 


Statistical modeling for Biomedical Researchers, W.D. Dupont 
Maximum Likelihood Estimation with Stata, W. Gould, J. Pitblado, B. Poi 
Statistics with Stata, L.C. Hamilton 

Generalized Linear Models and Extensions, J.W. Hardin, J.M . Hilbe 
Negative Binomial Regression, J.M. Hible 

A Short Introduction to Stata for Biostatistics, M. Hills, B.L. De Stavola 


Applied Survival Analysis: Regression Modeling of Time to Event Data, D.W. 
Hosmer, S. Lemeshow, S. May 


Applied Econometrics for Health Economists, A. Jones 
Applied Health Economics, A. Jones, N. Rice, T.B. d'Uva, S. Balia 
An Introduction to Stata for Health Researchers, S. Juul, M. Frydenberg 
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Data Analysis Using Sata, U. Kohler, F. Kreuter 

Sampling of Populations: Methods and Applications, P.S. Levy, S. Lemeshow 
Working in Data Analysis Using Stata, J.S. Long 


Regression Models for Categorical Dependent Variables Using Stata, J.S. Long, J. 
Freese 


A visual Guide to Stata Graphics, M. Mitchell 

Data Management Using Stata: A Practical Handbook, M. Mitchell 

Interpreting and Visualizing Regression Models Using Stata,M. Mitchell 
Seventy-six Stata Tips, H.J. Newton, N. J. Cox editors 

Analyzing Health Equity Using Household Survey Data, O. O'Donnell and others 
A Stata Companion to Political Analysis, P.H. Pollock III 

A Handbook of Statistical Analyses Using Stata, S. Rabe-Hesketh, B. Everitt 
Multilevel and Longitudinal Modeling Using Sata, S. Rabe-Hesketh, A. Skrondal 
Managing Your Patients? Data in the Neonatal and Pediatric ICU, J. Schulman 
Epidemiology: Study Design and Data Analysis, M. Woodward 


aug) 
إدارة البيانات‎ 


Data Management 








أول خطوة في تحليل البيانات تتضمن تنظيم صفوف البيانات» في JSS‏ 
يمكن به معرفة مفهوم برنامج ستاتا. يمكننا إدخال بيانات جديدة إلى ستاتا 
باستخدام عدة طرق: طباعة البيانات باستخدام لوحة المفاتيح» استيراد 
البيانات من برامج أخرى مثل برنامج مايكروسوفت إكسيل؛ قراءة البيانات 
من ملف نصي أو ملف ASCI‏ يحتوي على صفوف البيانات» لصق البيانات 
من جداول في المحررء أو استخدام برنامج يقوم بتحويل البيانات» ترجمة 
البيانات مباشرة من ملف نظام تم إنشاؤه بواسطة برنامج جداول إليكترونية 
آخرء أو قاعدة بيانات» أو برنامج إحصائي آخر. عند إدخال البيانات في 
PH a‏ ا و ا 
وتحديثه مستقبلا باستخدام ستاتا. 


إدارة البيانات تتضمن: المهام الأساسية التي عن طريقها يتم إنشاء ملف 
البيانات وتحرير هذه البيانات وتصحيح الأخطاءء وتحديد البيانات المفقودة» 
وإضافة مستتدات داخلية مثل المتغيرات والقيم والأسماء. كما أن إدارة 
البيانات تتضمن: العديد من الوظائف التي تتطلبها عملية التحليل مثل إضافة 
مشاهدة جديدة» أو متغير جديد» وإعادة التنظيم» واختيار عينة من البيانات» 
وفصل وتجميع أو إلغاء بيانات» وتحوير أنواع المتغيرات» وإنشاء متغيرات 
من خلال کر منطقية أو رياضية معينة. وعندما تكون عملية إدارة 
البيانات متكررة أو معقدةء Cà‏ مستخدمي ستاتا يمكنهم كتابة برنامج خاص 
بهم لإجراء العمليات بشكل تلقائي» حيث إن ستاتا معروف بقدرته التحليلية 
الفائقةء فيمكنه التعامل مع بيانات متنوعة» وكذلك إدارة مميزاتها. 
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Jal‏ المستخدم لبرنامج ستاتا User's. Guide‏ يعطي نظرة عامة على 
الطرق المختلفة لإدخال البيانات» ثم بعد ذلك يشرح تسع قواعد لتحديد 
الطريقة المناسبة. إدخال البيانات وتحريرها والعديد من المهام الأخرى 
سوف تتم مناقشتها في هذا الفصلء ويمكن القيام بهذه المهام من خلال قائمة 
«Data‏ وهي تحتوي على القوائم الفرعية التالية: 

Describe data - 

Data Editor — 

Create or change data — 

Variables Manager - 

Data utilities — 

Sort — 

Combine datasets — 

Matrices, Mata language — 

Matrices, ado language - 

Other utilities — 


Example Commands : عن الأوامر‎ alioi 





.append using olddata 

قم بقراءة ملف البيانات المخزن مسبقاً olddata.dta‏ ثم قم بإضافة 

مفرداته إلى ملف البيانات المستخدم حالياء بعد ذلك قم بكتابة الأمر 

save newdata, replace‏ فسوف يتم حفظ البيانات الموحدة في ملف جديد 
newdata.dta 443‏ 


.browse 

هذا الأمر يقوم بفتح جدول إلكتروني يشبه متصفح البيانات لمشاهدة 

بيانات» والمتصفح يشبه محرر البيانات» ولكن ليس لديه القدرة على تحرير 

البيانات» فلايوجد هناك خطر على تغيير البيانات بشكل غير مقصود؛ 
ويمكنك القيام بنفس الأمر بالنقر على أيقونة 3 

.browse year month extent if year» 1999 
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هذا الأمر يفتح متصفح UL‏ ويعرض فقط المتغيرات year, month,‏ 
cextent‏ كما يعرض المشاهدات التي تم إدخالها في سنة year‏ 1999 وما 
بعدهاء في هذا المثال if‏ تمثل الشرط المنطقي والذي يجب استخدامه Jal‏ 
العديد من أو آمو A f isa.‏ 38 
-compress‏ 
يقوم هذا الأمر بشكل تلقائي بضغط البيانات» وتحويل كل المتغيرات إلى 
أكثر أشكال التخزين كفاءة للمحافظة على السعة التخزينية للجهاز» ثم بعد 
ذلك قم بكتابة الأمر save filename, replace‏ وهذا سوف يحفظ 'تغييرات 
بشكل دائم. 
.drawrorm 21 z2 z3, n(5000)‏ 
يقوم هذا الأمر بإنشاء بيانات تحتوي على 5000 مشاهدة و3 متغيرات 
عشوائية هي 23 ,22 zi,‏ وهذه البيانات غير ALG ye‏ وتتوزع توزيعاً 
طبيعياً؛ وهناك خيارات يمكن استخدامها لتحديد المتوسطء والانحر اف 
المعياري ومصفوفات الارتباط. 
.dropmiss‏ 
وهذا الأمر يقوم تلقائياً بحذف أي متغير يحتوي على قيم مفقودة لكل 
المشاهدات» هذا الأمر يعتبر مفيدًا عند العمل مع كمية كبيرة من البيانات» 
حيث إن بعض المتغيرات الأصلية غير متعلقة بأي مشاهدة من المشاهدات 
المتبقية؛ وكتابة الأمر dropmiss, obs‏ سوف يقوم باستبعاد أي مشاهدات لها 
قيم مفقودة؛ دجب ملاحظة أن dropmiss‏ أمر تم برمجته بواسطة أحد 
المستخدمين. فهو لايأتي ضمن الأوامر الافتراضية في ستاتاء لذا يجب 
تحميله من الإنترنت وتنصيبه في ستاتاء ويمكنك الحصول على رابط التحميل 
عن طريقة طباعة الأمر -findit dropmiss‏ 
.edit‏ 
يقوم بفتح نافذة بها جدول البيانات» Cus‏ يمكنك إدخال وتحرير 
البيانات» ويمكن القيام بنفس الأمر بالنقر على أيقونة d‏ تحرير من شريط 
المهام. 
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.edit year month extent 
على‎ year, month, extent يقوم بفتح نافذة تحرير البيانات للمتغير ات‎ 
التوالي» ويمكنك تعديل البيانات حسب الحاجة.‎ 
.encode stringvar, gen (numvar) 
مع توصيفه بقيم رقمية‎ numvar يقوم هذا الأمر بإنشاء متغير جديد اسمه‎ 
stringvar على متغير نصي (غير رقمي) اسمه‎ ely 
.format rainfall %8.2£ 
rainfall للمتغير الرقمي‎ ) ۴ ( Cub يقوم هذا الأمر بإنشاء تنسيق عرض‎ 
يظهن ر قطان بعد الفاصلة‎ Lally Baci 8 بحيث يكون عرض عمود المتغير‎ 
العشرية؛ هذا الأمر يؤثر فقط في كيفية عرض البيانات» ولا يؤثر في‎ 
البيانات نفسها.‎ 
.generate newvar = (x*y)/100 
مضافاً إليها‎ x وهو يساوي‎ newvar يقوم الأمر بإنشاء متغير جديد اسمه‎ 
.100 والناتج مقسم على‎ y 
.generate newvar - runiform( ) 
يقوم هذا الأمر بإنشاء متغير جديد من قيم تم أخذها من توزيع عشوائي‎ 
منتظم» تتراوح مابين 0 وتقريباً 1 وتكتب (0,1]. وللحصول على معلومات‎ 
عن الدوال التي تقوم بإنشاء بيانات عشوائية من التوزيع الطبيعي» والتوزيع‎ 
وتوزيع جاماء وتوزيع بواسونء والتوزيعات الأخرى قم‎ o الثنائي» وتوزيع‎ 
.help random y9! بكتابة‎ 
.import excel filename.xlsx, sheet ("mean") 
cellrange (a15:n78) firstrow 
باستيراد ورقة إكسيل داخل برنامج ستاتاء والخيار الثاني‎ el يقوم هذا‎ 
والتي تحتوي على‎ “mean” في هذا المثال» يوضح أن اسم الورقة هو‎ 
والصف الأول من هذه الخلايا يتضمن‎ .N78 إلى‎ AIS بيانات في الخلايا من‎ 
المتغير ات.‎ e aud 


.infile x y z using data.raw 
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هذا الأمر يقوم بقراءة الملف المسمى data.raw‏ والذي يتضمن بيانات 
ثلاثة متغيرات هي 2 x, Y,‏ والقيم المتعلقة بهذه المتغيرات الثلاثة تم daill‏ 
بينها بمسافة واحدة (يمكن استخدام الفراغات ومسافة TAB‏ والفواصل 
والخطوط)» المسافات تحدد القيم المفقودة للمتغيرات الرقمية» والتي يجب أن 
يتم تمثيلها بواسطة الفترات وليس الفراغات؛ استخدام الفاصلة كحد فاصل 
بين القيم والفراغات أو فاصلتين متتاليتين للقيم المفقودة. وللحصول على 
تفاصيل أكثر عن الأوامر التي تقوم بقراءة البيانات من ملفات مختلفة 
واستيرادها داخل ستاتا قم بطباعة -help infiling «J|‏ 
¿List‏ 
يقوم بعمل قوائم للبيانات في التنسيق الافتراضي للجداول» عند العمل مع 
حجم بيانات ضخم» فإن تنسيق الجداول يصبح مهمة صعبةء لذا فإن استخدام 
الأمر list‏ والأمر display‏ يعطي نتائج مفيدة. للحصول على معلومات عن 
الخيارات الأخرى المتوافرة مع هذا الأمرء قم طباعة الأمر thelp list‏ كما 
أن محرر البيانات Data Editor‏ ومتصفح البيانات Data Browser‏ يوفر 
العديد من الخيارات للمعاينة حسب الغرض المطلوب. 
.list x y z in 5/20‏ 
يقوم هذا الأمر بعمل قائمة بالمتغيرات y, z‏ :ته والقائمة تتضمن 
المشاهدات من المشاهدة رقم 5 إلى المشاهدة رقم 20 حسب تسلسل إدخالها. 
emerge 1:1 id using olddata‏ 
asi‏ هذا الأمر بقراءة البيانات المخزنة مسبقاً بملف olddata, dta‏ 
للمتغير id‏ ثم يقارن المشاهدات الموجودة بالملف مع تلك المشاهدات 
الموجودة بالملف الحالي المفتوح» Cus‏ تتم مقارنة المشاهدات واحدة بواحدة 
ويجب أن يتم ترتيب بيانات الملفين وفقا للمتغير vid‏ 
.mvdecode var3-var62, mv (97=.\98=.a\99=.b)‏ 
بالنسبة للمتغيرات من var3‏ وحتى Var62‏ قم باعتبار القيم 97 98 99 
على أنها ad‏ مفقودة. في هذا المثال» نحن نستخدم ثلاثة رموز مختلفة 
لتعريف القيم المفقودة وهي a, b‏ ,. هذه القيم يمكن الاستعاضة عنها باستخدام 
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أسباب نقص هذه القيم مثل كتابة غير قابلة للتطبيق «Not applicable‏ غير 
معروف «Don't know‏ رفض الإجابة Refused to answer‏ إذا كان 
المطلوب هو استخدام رمز واحد للقيم الناقصة. إذن يمكننا تحديد رمز واحد 
للقيم المفقودةء فإذا قمنا باستخدام (.) فإن الأمر يمكن كتابته ).=99 98 mv(97‏ 
.replace oldvar - 100 * oldvar‏ 
يقوم الأمر باستبدال قيم المتغير 014007 بقيم جديدة تم حسابها بضرب 
القيم القديمة للمتغير القديم في 100. 
.sample 0‏ 
يقوم الأمر بحذف كل المفردات في الملف الحالي المفقوح باس eL‏ 
0 سوف يتم الإبقاء عليها كعينة عشوائية؛ فبدلاً من اختيار نسبة محددة 
يمكننا اختيار عدد محدد من الحالات» فمثلاً sample 55, count‏ سوف يقوم 
بحذف كل المشاهدات باستثناء عينة حجمها 55 مشاهدة. 
.save newfile‏ 
يتم حفظ البيانات في الملف المفتوح حالياً .newfile.día: aual‏ إذا 
كان الملف newfile.dta‏ موجودا مسبقاء وتريد الكتابة على الإصدار السابقء 
يمكنك كتابة الأمر «save newfile, replace‏ أو يمكنك القيام بنفس المهمة عن 
طريق قائمة «File‏ ولحفظ الملف newfile.dta‏ بتنسيق ستاتا 9 قم بكتابة الأمر 
saveold newfile‏ » قم .File > Save As > Save as type Jub‏ 
sort x‏ 
يقوم هذا الأمر بترتيب مشاهدات المتغير × تصاعدياً من أقل قيمة إلى 
أعلى قيمة» وتظهر القيم المفقودة في نهاية القائمة» GY‏ برنامج ستاتا يعتبر 
القيم المفقودة أعلى قيم. للحصول على معلومات أكثر حول أمر الترتيب 
calal‏ قم بطباعة الأمر + Cus help‏ يوفر معلومات عن خيارات 
الترتيب vigas Lua 3 MEETS‏ أو وضع القيم المفقودة في البداية. 
.tabulate x if y> 5‏ 
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يقوم هذا الأمر بإنشاء جدول تكراري للمتغير × فقط باس تخدام 
المشاهدات التي يناظرها المتغير y‏ يزيد على 65 استخدام if‏ يشبه تماما 
استخدامها مع معظم أوامر ستاتا الأخرى. 
.use oldfile‏ 
يقوم هذا الأمر باستخدام ملف البيانات المخزن مسبقاً باسم -oldfile.dta‏ 
إذا كان هناك ملف بيانات مفتوح حالياء وتريد إلغاء هذه البيانات بدون حفظها 
فيمكنك طباعة الأمر use oldfile, clear‏ أو يمكنك القيام بنفس المهمة عن 
طريق اختيار File > Open‏ أو الضغط على أيقونة ت 


: Data obl 3 بطباعنها‎ Obl إنشاء‎ 
Creating a New Dataset by Typing in Data 


البيانات التي تم حفظها مسبقاً في ملف ستاتاء يمكن اس تخدامها بفتح 
الملف المخزن بأمر use filename‏ أو من خلال القوائم. في هذا الجزءء سوف 
يتم شرح المهارات الأساسية لإنشاء ملف بيانات باستخدام برنامج ستاتاء 
حيث يمكننا ببساطة طباعة البيانات يدويا في نافذة تحرير البيانات Data‏ 
Editor‏ أوإدخال البيانات يدوياً. وهذا يعتبر عملياً عندما يكون حجم البيانات 
بسيطاً أو البيانات ليست مخزنة على وسيلة إلكترونية مثل ملف إكسيل؛ ولكن 
هناك العديد من الطرق الأخرى لإدخال البيانات. 

الجدول (1.2) يعرض بعض المعلومات عن الولايات والأقاليم الكندية؛ 
وهذه البيانات يمكن استخدامها لتوضيح كيفية إدخال البيانات يدويا. تم 
الحصول على هذه البيانات من لجنة الإشراف الإقليمية البلدية الاتحادية على 
صحة السكان لسنة 1996ء أحدث أقاليم كندا (Nunavut)‏ لم يتم إدراجها 
ضمن البيانات» وذلك لأنها كانت جزءًا wn‏ من الأقاليم الشمالية الغربية 
حتى سنة 1999. 
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ar unie sci un | a a ad 
جدول )1.2( : بيانات عن كندا وولاياتها‎ 
العمر‎ 


Canada 
Newfoundland 


Prince Edward 
Island 


Nova Scotia 
New Brunswick 
Quebec 

Ontario 
Manitoba 
Saskatchewan 
Alberta 

British Columbia 
Yukon 


Northwest 
Territories 


عدد 
السكان 
1995 
(بالآلاف) 
Pop.‏ 1995 
(1000s)‏ 


العمر المتو e‏ 
للإناث 
(سنوات) 
Female Life‏ 


Expectancy 
years) 


معدل البطالة 

(نسبة) للذكور 
(سنوات) 
Male Life‏ 


Expectancy 
(years) 


Unemployment 
Rate (percent) 


29606.1 
575.4 


136.1 


937.8 
760.1 
73342 
11100.3 
1137.5 
1015.6 
2741.0 
3766.0 
30.1 


65.8 





أسهل طريقة لإنشاء ملف بيانات من بيانات مطبوعة على ورق مكل 
الجدول )1.2( هي استخدام نافذة تحرير البيانات Data Editor‏ والتي تظهر 
من خلال S‏ على b‏ أو من خلال اختيار Window < Data Editor‏ من 
قائمة ستاتا أو من خلال طباعة الأمر cedit‏ ثم بعد ذلك قم بطباعة قيم كل 
متغير» الأعمدة تتم تسميتها cvar2 «var!‏ الخ؛ لذلك فإن var!‏ يحتوي على 
بيانات المكان «place.‏ و var2‏ يحتوي على بيانات aac‏ السكان وهكذا. 


يمكننا وضع أسماء أكثر تعبيراً عن المتغيرات وذلك بالنقر على أعلى 
كل عمود (مثلاً المتغير (var‏ في نافذة تحرير البيانات» تم كتابة الاسم 
الجديد في مربع حوار النتائج» بالرغم من أن اسم المتغير يمكن أن يحتوي 
Y) d s 32 ule‏ أنه من of Denial‏ کین من 8 ch‏ أو أل كبا 
يمكتنا Leal‏ أن lias quai‏ يضمن شرحاً مختصير! Se od ay xia e‏ 


A 
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2 (عدد السكان (population‏ يمكن تسميته pop‏ ويعطى شر 5 مختصرًا 
في حقل -"Population in 1000s, 1995" Toi variable lable‏ 









لعداطلت 





File Edit View Data Tools 


(Jd a aids Pg. 


var ify] Canada 






; — — " 
5 vari var2 var3 vara VA اجو ري‎ 
9il i[ canada] 29606. 1 10.6 75.1 81.1 

£ 

& | 2 Newfoundland 575.4 19.6 73.9 79.8 + 
2 
E 

v‏ د 

SA 

pq i 

v]: iT we sti2 i 












4| »[ ! [Format 96126 zl 


Vars: 5 Order: Dataset — Obs:2 Fiter: Off Mode; Edt Li 









‘Data Editor تسمية المتغيرات يمكن أن تتم في نافذة تحرير البيانات‎ ale] 
يلي:‎ LS labelvariable y rename أو من خلال استخدام الأوامر‎ 

rename varZpop 
-label variable pop "Population in 1000s, 1995" 
unemployment rates الفضاءات التي تم تر كها خالية» مثل معدلات البطالة‎ 
كنبا‎ C anis سوف يعتبرها ستاتا‎ Northwest Territories 3 Yukon للولايات‎ 
نافذة تحرير البيانات في أي وقت» وحفظ البيانات في‎ GUE! مفقودة» ويمكننا‎ 
Data > Data الجهاز؛ عند الضغط على أيقونة تحرير البيانات 57 أو اختيار‎ 

Editor‏ أو طباعة الأمر edit‏ سوف يتم إرجاعك إلى نافذة تحرير البيانات. 
إذا كانت القيمة الأولى التي تم إدخالها لمتغير ما رقم - مثل عدد السكان 
population‏ ومعدل البطالة unemployment rate‏ و العمر المتو life c‏ 
expectancy‏ — فإن Giu‏ سوف يعتبر العمود متغيرًا dad‏ ولاحقاً سوف 
ko AR.‏ المتغير. القيم الرقمية يمكن أن تبدأ بعلامة زائد 
و ناقص» ويمكن أن تتضمن علامة عشرية أو تعبيرات رياضية. فمثلا 
= التعبير عن عدد سكان lai‏ كرقم 2.960616+7 وهذا يساوي 2.96061 
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7 × أي حوالي 29.6 مليون نسمة؛ يُفترض ألا تحتوي الأرقام على أي 
فواصل مثل 29,606,100 (ويمكن استخدام الفواصل كعلامات عشرية). وإذا 
حدث هذاء فإن ستاتا سوف يعتبر المتغير كمتغير نصي وليس متغيراً 
رقمياً. 
إذا كانت القيمة الأولى التي تم إدخالها لمتغير ما حرفاً وليست bá)‏ 
- مثل اسم المكان في الجدول السابق - فإن ستاتا سوف يعتبر ذلك المتغير 
T uiia‏ نصياً. . قيم المتغير النصي يمكن أن تتضمن حروفاً وأرقاماً وتعبيرات 
ومسافات حتى 244 dis.‏ المتغيرات النصية يمكن أن تحفظ أسماء 
وعلامات تنصيص وأي معلومات توضيحية أخرى» كما يمكن وضع 
المتغيرات النصية في جداول ويمكن عدّهاء ولكن لا يمكن تحليلها باس تخدام 
المتوسط الحسابي والارتباط أو أغلب العمليات الإحصائية الأخرى؛ وفي 
نافذة محرر البيانات Data Editor‏ أو نافذة متصفح البيانات Data Browser‏ 
تظهر المتغيرات النصية بلون أحمر يميّزها عن المتغيرات الرقمية التي 
تظهر بلون أسود أو أسماء المتغيرات الرقمية (الزرقاء). 
بعد طباعة المعلومات من الجدول (1.2) سوف نقوم بإغلاق نافذة محرر 
البيانات Data Editor‏ وحفظ البيانات باسم Canadal.data‏ وذلك بالأمر 
¿save Canadal‏ 
برنامج ستاتا سوف يقوم تلقائياً بإضافة امتداد dta‏ إلى ملف البيانات ما 
لم تقم بكتابة أي شيء آخرء إذا كنا قد قمنا بتخزين الملف مسبقا بنفس الاسم 
فإنه من المحتمل أن يتم تخزين الإصدار الأحدث من نفس الملف» وذلك 
بطباعة الأمر التالي: 
.save, replace‏ 
عند هذه النقطة ملف البيانات سوف يظهر كما يلي: 


.describe 
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Contains data from C:\data\Canadal.dta 


obs: 13 Canadian dataset 1 

vars: 5 4 Jul 2012 11:21 

size: 481 

storage display value 

variable name type format label variable label 
place str21 %21s Place name 
pop float %9.0g Population in 1000s, 1995 
unemp float %9.0g % 15+ population unemployed, 1995 
mlife float %9.0g Male life expectancy years 
flife float %9.0g Female life expectancy years 
————————————————————————————— 
Sorted by: 
.list 
















place mlife 





pop  unemp 




















1. Canada 29606.1 10. 
2. Newfoundland 575.4 19. 
3. Prince Edward Island 136.1 19. 
4. Nova Scotia 937.8 13. 
Sie New Brunswick 760.1 13. 
6. Quebec 7334.2 13. 
Yi Ontario 11100.3 9. 
8. Manitoba 2137.5 8 
9. Saskatchewan 1015.6 

10. Alberta 2747 8. 

als British Columbia 3766 9. 

12. Yukon 30.1 

13. Northwest Territories 65.8 


.Summarize 


Variable Obs Mean Std. Dev. Min Max 
vari 0 

pop 13 4554.769 8214.304 30.1 29606.1 

var3 11 12.10909 4.250048 7 19.6 

var4 13 74.29231 1.673052 70.2 75.8 

var5 13 80.71539 .9754027 78 81.8 


اختبار مثل هذه المخرجات يعطينا الفرصة لرؤية الأخطاء التي يُفترض 
أن يتم تصحيحهاء Stud‏ جدول summarize‏ يوضح مجموعة من الأرقام 
المفيدة للمراجعةء وهذه الأرقام تتضمن ase‏ المشاهدات الرقمية (دائما 0 
للمتغيرات النصية) وأقل وأعلى قيمة لكل متغيرء التفسير الموضوعي 
للإحصائيات المختصرة عند هذه النقطة سابق لأوانه» GY‏ البيانات تحتوي 
على مشاهدة واحدة (كندا) والتي Jus‏ دمجا لباقي 12 ولاية. 
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الخطوة التالية هي إعطاء البيانات توثيقاً ذاتياً أكبر من خلال إعطاء 
المتغيرات أسماء أكثر وضوحاًء وذلك كما يلي: 

.rename vari place 

.rename var3 unemp 

.rename var4 mlife 

.rename var5 flife 


ويمكن القيام بنفس المهمة في خطوة واحدة كما يلي: 


.rename (vari var2 var4 var5)(place unemp mlife 
flife) 


يتيح Gl‏ برنامج ستاتا إضافة عدة أنواع من التوصيفات إلى البيانات» 
label data yaY!‏ يشرح البيانات كذلك» بينما الأمر c X label variable‏ كل 

متغير على das‏ وذلك كما يلي: 
.label data "Canadian dataset 1"‏ 


.label variable place "Place name" 


.label variable unemp 9615+ population 
unemployed, 1995" 


.label variable mlife "Male life expectancy 
years" 


.label variable flife "Female life expectancy 
years” 


بإعطاء وصف للبيانات والمتغيرات» سوف نحصل علي بيانات توضح 
نفسهأ بنفسها من خلال التوصيفات: 


. describe 


Contains data from C:\data\Canadal.dta 





obs: 13 Canadian dataset 1 

vars: 5 4 Jul 2012 11:21 

size: 481 

storage display value 

variable name type format label variable label 
place str21 %21s Place name 
pop float %9.0g Population in 1000s, 1995 
unemp float %9.0g % 15+ population unemployed, 1995 
mlife float %9.0g Male life expectancy years 
flife float %9.0g Female life expectancy years 


Sorted by: 
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عند إنهاء توصيف المتغيرات يُفترض أن نقوم Bia‏ هذه المتغيرات 
باختيار File > Save‏ أو بكتابة الأمر 





.Save, replace 
سوف نقوم بفتح ملف البيانات بالنقر على أيقونة . باختيار‎ cay 
أو بكتابة الأمر‎ File < Open 
.use C:\data\Canadal 
التقدم في عملية تحليل البيانات» ريما تلاحظ أن هناك‎ o يمكننا‎ 
وهذان‎ flife والإناث‎ mlife بين العمر المتوقع للذكور‎ hia ارتباطاً‎ 
الارتباط بين العمر‎ unemp المتغيران يرتبطان بشكل سلبي مع معدل البطالة‎ 
المتوقع ومعدل البطالة يكون أقوى للذكور منه للإناث.‎ 


-correlate unemp mlife flife 





(obs=11) 
unemp mlife flife 
unemp 1.0000 
mlife -0.7440 1.0000 
flife -0.6173 0.7631 1.0000 


ترتيب المشاهدات في ملف البيانات يمكن تغييره باستخدام الأمر cort‏ 
فمثلاً لإعادة cas‏ المشاهدات من الأصغر للأكبر حسب متغير عدد السكانء 
قم بطباعة الأمر التالي: 

.Sort pop 

المتغيرات النصية يمكن ترتيبها TP‏ فطباعة الأمر sort place‏ 
سوف يعيد ترتيب المشاهدات و Alberta (NOT‏ أو British Columbia «Y‏ ثانياً 
وهكذا. 

order je‏ يقوم بترتيب e‏ في ملف البيانات» SIS ad‏ يمكننا 

.order place unemp mlife flife pop 

محرر البيانات Data Editor‏ توجد به قائمة Tools‏ وبها axe‏ من الخيارات 

التي يمكن أن تقوم بنفس المهام السابقة. 
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يمكننا إجراء تحديد للمتغيرات المراد العمل عليها في نافذة محرر البيانات 
Data Editor‏ بحيث تعرض فقط المتغيرات التي يُراد تغييرها أو إدخال بيانات de‏ 
فمثلاً الأمر التالي يعرض فقط ثلاثة متغيرات في نافذة محرر البيانات. 
.edit place mlife flife‏ 
T‏ 
.edit place unemp if pop» 100‏ 
الأمر الأخير يستخدم if‏ والتي تعتبر أداة مهمة» وسوف يتم شرحها في 
الأجزاء اللاحقة. 
إنشاء؟ ملف Copy cu Finem" yx obly‏ ولصف Paste‏ : 
Creating a New Dataset by Copy and Paste‏ 


عندما تكون البيانات الأصلية مخزنة على وسيلة إليكترونية مثل صفحة ويب 
أو ملف نصي أو ملف إكسيل أو ca yyy‏ فيمكننا جلب هذه البيانات لبرنامج ستاتا 
باستخدام tpaste y copy‏ فمثلا مركز. بيانات المناخ الو طني National Climate‏ 
Data (NCDC) Center‏ يعرض توقعات Gla ja‏ الحرارة العالمية غير الاعتيادية 
(الانحرافات عن متوسط درجات الحرارة في الفترة ما بين 1901 إلى 2000 
بالدرجات المئوية) لكل شهر في الفترة الماضية حتى يناير 1880ء مؤشر 
NCDC‏ هو أحد المؤشرات التي تعتمد على شبكة عالمية للبيانات من محطات 
الأرصادء وقياسات حرارة ad ghu‏ ويقوم NCDC‏ بتحديث المؤشر شهرياًء 
وينشر هذه التحديثات على الإنترنت؛ وأدناه الخمسة أشهر الأولى من هذه 
البيانات» أول قيمة 0.0623- تشير إلى أن يناير 1880 كان عالمياً °C‏ 0.06 أكثر 
برودة من متوسط درجات الحرارة في القرن العشرين. 


1880 1  -0.0623 
1880 2 -0.1929 
1880 3 -0.1966 
1880 4 -0.0912 
1880 5 -0.1510 


oly‏ على تفاصيل كيفية تنظيم البيانات الخام (بما فيها القيم المفقودة) قد 
لايمكننا استخدام نسخ copy‏ البيانات ككل ثم لصقها paste‏ في نافذة محرر 
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البيانات aii Data Editor‏ يتم توسيط خطوة أخرى مفيدة وذلك من خلال 
وضع فاصلة بين القيم» وأسهل طريقة لعمل ذلك تتم من خلال نسخ جميع 
الأرقام ثم لصقها في نافذة الملف التنفيذي لبرنامج Do-File Editor tis‏ 
وهذه النافذة عبارة عن محرر بيانات بسيط يحتوي على العديد من التطبيقات» 
ثم قم باستخدام وظيفة استبدال في نافذة الملف التنفيذي من خلال 
اختيار Edit » Find < Replace‏ وذلك لاستبدال كل المسافتين الموجودتين 
بين البيانات بمسافة baal g‏ قم j| Su‏ هذه الخطوة عدة مرات حتى يتم حذف 
كل المسافتين وجعلها مسافة baal g‏ بين كل البيانات» ثم آخر خطوة هي 
استبدال الكل Replace All‏ المسافة الواحدة بفاصلة؛ بذلك نكون قد قمنا 
باستخدام Do-File Editor‏ لوضع فواصل بين القيم» وبذلك تكون البيانات في 
تنسيق معروف لكثير من البرامج؛ كما يمكننا أيضا وضع أسماء المتغيرات 
في الصف الأول مع إضافة فواصل بينهاء وتكون البيانات على الشكل التالي: 

year,month, temp 

1880,1,-0.0623 

1880,2,-0.1929 

1880,3,-0.1966 


1880,4,-0.0912 
1880,5,-0.1510 


يمكننا GY!‏ نسخ البيانات من Do-File Editor‏ باختيار Edit > Select All‏ 
ولصق البيانات في نافذة محرر بيانات خالية في برنامج ستاتاء وذلك باختيار 
Paste Special‏ مع فاصلة Comma‏ ثم حدد الخيار Treat first row as‏ 


Variable names 
Hi Data Editor (Edit) -Luntitied] E N O E c عدلعلج‎ 



















Fle Edt View Data Tools 
jad a [s TM Aig 


year1] 1880 





temp 
-.0623 
~.1929 


1880 
1880 
1880 
1880 


wpysdeuc: Te 


-.19660001 
7.0912 
-7.15099999 
1880 7.1886 
1880 
1880 2 
1880 -.1072 I Label year 
1880 -.18430001 | | Tope nt 
ES P5 RE P Format %10.09 
ا‎ rf Value Label _ m 


Vars: 3 Order: Dataset Obs: 1,584 Filter: Off Mode: Edt LAF S5: 


-.1716 
-.1025 


هرابع شاه م هاب ضاق 5 5 


2n 
Sveervranneune 


^ 
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evil‏ بوضع فواصل بين القيم في ملف امتداده «(.esv)‏ يمكن القيام يه 

باستخدام أي برنامج جداول إلكترونية أو باستخدام برنامج ستاتا نفسه» والذي 

يجعل البيانات قابلة للنقل بشكل مريح» ولقراءة ملف امد اده csv.‏ باس تخدام 
ستاتا مباشرة يمكن طباعة الأمر insheet‏ وذلك كما يلي 

.insheet using C:\data\global1.csv, comma clear 

والبيانات» ثم حفظ النتائج في ملف ستاتا LS‏ يلي: 
.label data "Global climate"‏ 
.label variable year "Year"‏ 


.label variable month "month" 
.label variable temp "NCDC global temp anomaly 


vs 1901-2000, c" ` 

.save c: NdataNgloball.dta 
0 

.describe 
Contains data from C:\data\globall.dta 

obs: 1,584 Global climate 
vars: 3 4 Jul 2012 11:21 
size: 11,088 

storage display value 

variable name type format label variable label 
year int %8.0g Year 
month byte 58 09 Month 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 
Sorted by: 


: if و‎ in البيانات باستخدام اطحددات‎ à» فرعية‎ ClO wis 
Specifying Subsets of the Data: in and if Qualifiers 
العديد من أوامر ستاتا يمكنها تحديد فئة البيانات التي تعمل معهاء وذلك‎ 
إلى الأمر نفسهء كما أن هذه المحددات متوافرة‎ if بإضافة المحددات هذ أو‎ 
في أعلى نوافذ‎ by/iffin أو‎ ifin عن‎ dad في العديد من قوائم ستاتا:‎ 
يطلب من ستاتا أن يقوم بعمل قائمة‎ list in 5 الحوار. فعلى سبيل المثالء‎ 
ولعمل قائمة بالخمس مشاهدات الأولى» قم بطباعة‎ cul] للخمس مشاهدات‎ 

الأمر. 

.list in 1/5 
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year month 


جم زح س OF‏ 





الحرف )1( في الأمر أعلاه يحدد آخر مشاهدة و(10-) يقوم بتحديد 
المشاهدة رقم (10) من أسفل القائمة. فبيانات درجات الحرارة العالمية التي 
تغطي فترة 1584 شهرا تحتوي على أعلى )10( أشهرء والتي كانت فيها 
درجات حرارة غير اعتيادية» وهذا يعني أن درجات الحرارة هذه كانت أعلى 
من متوسط درجات الحرارة خلال أشهر الفقترة من 1901 إلى 2000؛ 
ولإيجاد ذلك يجب علينا أولاً ترتيب درجات الحرارة من أقل قيمةء إلى أعلى 
قيمة ثم إيجاد ال (10) درجات من أسفل القائمة كما يلي: 
¿sort temp‏ 
.list in -10/1‏ 


year month temp 


1575. 
1576. 
1577. 
1578. 
1579. 


1580. 
1581. 
1582. 
1583. 
1584. 








لاحظ أهمية التفرقة بين )1( (رقم واحدء أو أول مشاهدة) وحرف )1( 
(حرف إل أو آخر مشاهدة) في الأمر أعلاه. 
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المحدد in‏ يمكن استخدامه بنفس الطريقة مع أغلب o4 d‏ تحليل وتحرير 
البيانات» ودائماً يشير إلى البيانات كما تم ترتيبها في آخر مرة أما المحدد if‏ 
فله العديد من التطبيقات» ولكنه يختار المشاهدات oly‏ على ad‏ متغير (Mis‏ 
Sad‏ لعرض gia)‏ سط الحسنابي والاتحرافه المعتاري ادرجة السرارة غير 
الاعتيادية قبل سنة 1970 نقوم بطباعة الأمر التالي: 


.summarize temp if year« 1970 


Variable Obs Mean Std. Dev. Min Max 





temp 1080 -.1232613 .1829313 -.7316 .4643 
ولتلخيص درجات الحرارة في السنوات الأخيرة نقوم بطباعة الأمر:‎ 
.summarize temp if year»- 1970 
Variable Obs Mean Std. Dev. Min Max 


temp 504 .3159532 .2300395 -.2586 .8422 


DEI‏ (أقل من)() FEIN‏ (أكبر من أو تساوي) هي علامات 


متعلقة بالأوامر: 
=“ يساوي 
je‏ لاتساوي )=~ تقوم بنفس المهمة) 
3 أكبر من 
* أصغر من 
i‏ أكبر من أو تساوي 
as‏ 


أصغر من أو تساوي 
لاحظ أن علامتي يساوي "==" تشيران إلى الاختبار المنطقي "هل القيمة 
في الطرف الأيسر تساوي القيمة التي في الطرف الأيمن؟" . بالنسبة لبرنامج 
ستاتاء فإن علامة يساوي واحدة تعني شيئاً des ‘thy ba yel‏ القيمة 


Lay ©‏ أن اتجاه علامتي أكبر من وأصغر من خاصة باللغة الإنجليزيء وذلك لأن 
جميع أوامر ستاتا باللغة الإنجليزيةء OY‏ هذه العلامة سوف يكون اتجاهها في الجهة 
المعاكسة في حالة اللغة العربية. 
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التي في الطرف الأيسر مساوية للقيمة التي في الطرف الأيمن'“ علامة = 
Pd‏ علامة متعلقة بالأوامر» ولا يمكن استخدامها مع محدد cif‏ وذلك 
لأن علامة = واحدة لها معان أخرىء فعلامة = واحدة تظهر في تطبيقات 
محددة مثل الأوزان واختبار الفرضيات. 

استخدام علامة أو أكثر متعلقة بالأوامر يمكن أن يتم مع محدد if‏ واحد» 
alld,‏ باستخدام العلامات المنطقيةء والعلامات المنطقية في ستاتا هي: 

and"; علامة‎ & 

or" gl" علامة‎ | 

! علامة noto‏ )~ تقوم بنفس المهمة) 

الأقواس تسمح لنا بتحديد أسبقية العمليات» فلعرض ملخص درجات 
الحرارة غير الاعتيادية لشهري يناير وفبراير للسنوات من 1940 إلى 
9 نقوم باستخدام الأمر التالي: 


.summarize temp if(month == 1 | month == 2) 
&year»-1940 &year«1970 





ملاحظة A aga‏ بشأن البيانات المفقودة: ستاتا سوف يعرض البيانات 
المفقودة كفترة» ولكن في بعض العمليات (بشكل ملحوظ if sort‏ بالرغم من 
أنها ليست عمليات إحصائية مثل المتوسط الحسابي أو الارتباط)» هي نفس 
القيم abel uli y bail‏ معاملة أكبر dus ys ad‏ فمثلاً بافتراض أننا نريد 
تحليل بيانات استطلاعات الرأي» الأمر التالي سوف يقوم بعمل جدول 
انتخاب للمشاركين الذين أعمارهم 65 سنة وأكبرء وكذلك المشاركين الذين 
أعمارهم عبارة عن قيم مفقودة: 
.tabulate vote if age>= 5‏ 
ولكن عند وجود قيم مفقودة؛ فإننا نحتاج إلى التعامل معها بشكل BS)‏ 
تحديدا من خلال استخدام محدد if‏ كما يلي: 
.tabulate vote if age»- 65 & !missing (age)‏ 
خيار عدم عرض alll‏ المفقودة» ( !missing(‏ يعتبر طريقة dale‏ 
لاختيار المشاهدات مع عدم عرض القيم المفقودةء بالرغم من أننا اس تخدمنا 
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حتى الآن الرمز الافتراضي للقيم المفقودة وهو "." إلا أن ستاتا يمكنه 
استخدام أكثر من 27 رمن لهذه القيم؛ فاستخدام if missing (age)‏ سوف 
يضع جانباً القيم المفقودة. وللحصول على معلومات أكثر عن القيم المفقودة 
قم باستخدام .help missing yY!‏ 

هناك طرق مختلفة لاستيعاد القيم المفقودة من العرضء فدالة (missing)‏ 
تقوم بعرض )1( إذا كانت القيمة مفقودة و(0) إذا لم تكن مفقودة؛ فمكلاً 
لوضع جدول الانتخاب للمشأهدات التي ليس لها قيم مفقودة لمتغيرات العمر 
«age‏ و الدخل income‏ التعليم education‏ قم بطباعة الأمر 


.tabulate vote if missing (age, income, 
education) -- 


s وحيث إن القيمة المفقودة الافتراضية هي "." وستاتا يعتبرها‎ d id 
يمكننا‎ «Sf تعتبر‎ (Y وهناك قيم مفقودة أخرى (سوف يتم شرحها‎ ag 
استخدام علامة أقل من أو علامة لايساوي ">" لاستبعاد عرض ن القيم المفقودة‎ 
كما يلي:‎ 

.tabulate vote if age«. &income«. &Education«. 
المشاهدات مؤقتاً عند‎ gau يمكن استخدامهمآ لاستبعاد‎ fign. المحددان‎ 
عدم قدرة أمر معين على العمل» هذان المحددان ليس لهما أي تأثير على‎ 
البيانات المخزنة» فالأمر أدناه سوف يطبق على كل المشاهدات مالم يتم‎ 
drop ولحذف متغيرات من البيانات» قم باستخدام الأمر‎ df استخدام هذ أو‎ 
عودة إلى ملف بيانات كندا‎ «(Data Editor استخدم نافذة محرر البيانات‎ jl) 
من البيانات‎ flife والمتغير‎ mlife يمكننا حذف المتغيرات‎ (Canadal.dta) 
بطباعة الأمر.‎ 
.drop mlife flife 

يمكن استخدام كل من if 3l in‏ لتحديد المشاهدات التي يراد حذفهاء 
فمثلاً 12/13 drop in‏ يعني قم بحذف المشاهدات 12 و13 في البيانات» كما 
يمكننا كذلك حذف مشاهدات محددة أو متغيرات محددة باالضغط على زر 
6 أتناء استخدام نافذة محرر البيانات „Data Editor‏ 
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Yay‏ من حذف مشاهدات أو متغيرات في ملف بيانات ct ua‏ يمكتنا 
أحياناً أن نقوم بتحديد ما نريد الإبقاء عليه؛ Ya Wied‏ من استخدام أمر drop‏ 
للمتغير mlife‏ و المتغير flife‏ من ملف Canadal.dta‏ يمكن القيام بنفس 
المهمة باستخدام الأمر c keep.‏ وكتابة المتغيرات الثلاثة الأخرى LS‏ يلي: 
.keep place pop unemp‏ 
مثل الكثير من التغييرات التي يتم القيام بها في برنامج ستاتاء فإن كل 
تغيير لن يتم الإبقاء عليه في ملف البيانات ما لم نقم بحفظ ذلك التغيير» عند 
هذه النقطة سوف يكون لدينا الخيار (replace « save)‏ وبذلك تتم التغييرات 
في الملف الحالي؛ كما يمكن حفظ البيانات في ملف جديد باختيار < File‏ 
Save As‏ أو بطباعة الأمر save newname‏ ويكون لديك بجهازك ملفان 
اقنان للبيانات. 


Generating and Replacing Variables : واأسنبدال اطتغيرات‎ sunl 


أمر الإنشاء generate‏ والاستبدال replace‏ يتيح Ul‏ إنشاء متغيرات 
جديدة» أو تغيير قيم المتغيرات الحالية» فمثلا في أغلب المجتمعات الصناعية 
dai;‏ هناك احتمال أن تكون النساء أطول عمراً من الرجال؛ ولتحليل التغير 
في أعمار الجنسين نقوم بفتح ملف «Canadal.dta‏ وإنشاء متغير جديد 
يساوي الفرق بين العمر المتوقع للإناث paal life‏ المتوقع للذكور cmlife‏ 
وعند استخدام الأمر generate‏ أو replace‏ سوف نقوم باس تخدام علامة 
يساوي واحدة. ١‏ 
.use C:\data\Canadal, clear‏ 
.generate gap = flife - mlife‏ 


.label variable gap "Female-male life 
expectancy gap” 


.describe gap 
Storage display value 
variable name type format label variable label 
——Ó— ———MMMMÀ O —— M MÓ€—IÀ € — 
gap float %9.0g Female-male life expectancy gap 


¿list place flife mlife gap 
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place flife 


Canada s : 6 

Newfoundland 8 3 -900002 

Prince Edward Island š 5 6.5 
Nova Scotia F 5 .200005 

New Brunswick 4 5 a 799995 


Quebec x 4. -699997 


Ontario : 5. .599998 
Manitoba 4 7 . 800003 
Saskatchewan s T .600006 
Alberta 4 e . 900002 


British Columbia š : -599998 
Yukon 5 = .099998 
Northwest Territories : - 800003 





بالنسبة لولاية Newfoundland‏ فإن القيمة الصحيحة ل gap‏ يفترض أن 
تكون 79.8 — 73.9 = 5.9 Aiu‏ ولكن بدلا من ذلك فإن جدول المخرجات 
أعلاه يعرض القيمة 5.900002 وذلك Gus GY‏ مثله مشل كل برامج 
الحاسب يقوم بتخزين الأرقام بنظام ثنائي والقيمة 5.9 ليس لها تعبير ثنائي. 
عدم الدقة البسيطة نتيجة التقريب في النظام الثنائي ليس لها تأثير على النتائج 
الإحصائية» ولكنها قد تثير الانتباه في قائمة البيانات؛ ويمكننا تغيير تنسيق 
العرض بحيث يعرض ستاتا قيماً مقربة. فالأمر التالي يجعل تنسيق العرض 
ثابتاً بحيث يكون عرض العمود كافياً لعرض أربعة أرقام وبعد الفاصلة يتم 
عرض رقم واحد فقط. 
.format gap 64 .‏ 
حتى عند عرض القيمة 5.9 بالأمر أعلاهء فإن الأمر التالي لن يستطيع 
عرض هذه القيمة عند طلبها تلك القيمة مباشرة. 
.list if gap == 5.9‏ 
هذا يحدث لأن ستاتا يعتقد بأن القيمة لا تساوي بالضبط 5.9 (تقنياً ستاتا 
يخزن قيم gap‏ بشكل مفرد كما هي» ولكن كل العمليات الحسابية تتم بالنظام 
الثنائي» وفي النظام المفرد والثنائي 9.5 لايمكن تحديدها بدقة). 
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تنسيقات العرض وتنسيقات أسماء المتغيرات والتوصيفات يمكن تغييرها 
ell s Lal‏ بالنقر مرتين على أي عمود في نافذة محرر البيانات «Data Editor‏ 
حيث يمكن وضع تنسيقات رقمية ثابتة مثل 904.14 كأحد أكثر التنسيقات 
الرقمية استخداماًء وهناك أيضًا عدة تنسيقات أخرى منها 
%w.dg‏ تنسيق رقمي ale‏ حيث إن يحدد العرض الكلي أو عدد 
الأعمدة التي سوف يتم عرضهاء il dy‏ عدد من الأرقام التي 
يجب أن تظهر بعد الفاصلة» أما بخصوص التعبيرات الأسّية (مثل 
7 والتي تعني 107 1.00X‏ أو تعني 10 ملايين) سوف يتم 
استخدامها بشكل تلقائي عند الحاجةء وذلك لعرض القيم بأفضل 
6 تنسيق رقمي ثابت» حيث cj‏ يحدد العرض الكلي أو عدد 
الأعمدة التي يتم عرضها وك عدد ثابت من الأرقام التي يجب أن 
تظهر بعد الفاصلة العشرية. 
46 تنسيق رقمي تصاعدي» حيث إن w‏ يحدد العرض الكلي أو عدد 
الأعمدة التي يتم عرضها و4 عدد ذابت من الأرقام التي يجب أن 
تظهر بعد الفاصلة العشرية. 
فعلى سبيل المثال» إذا نظرنا إلى الجدول (1.2) فإن عدد سكان كندا كان 
«lu 8 29,606,100‏ وكان عدد سكان إقليم يوكون Yukon‏ 30,100 تقريباًء 
الجدول أدناه يعرض كيف تظهر هذه الأرقام باستخدام تنسيقات مختلفة. 


Yukon التنسيق كندا يوكون‎ 
20100 2.96e+07 949.0g 
30100.0 29606100.0 969.1f 
3.01000e+04 2.96061e+07 %12.5e 


بالرغم من أن الأرقام المعروضة تظهر بصور مختلفة»ء فإن قيمها 
متطابقة تماماء وهذه التنسيقات لا تؤثر على العمليات الحسابية. خيارات 
التنسيق الأخرى للأرقام المعروضة تتضمن استخدام «ool sill‏ والمحاذاة 
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لليمين واليسارء وكذلك عدد الأصفار التي تظهرء وهناك a (i‏ تنسيقات 
خاصة للتواريخ ولمتغيرات السلاسل الزمنية والمتغيرات النصيةء وللحصول 
على معلومات أكثر حول التنسيقات قم بطباعة الأمر help format‏ 
الأمر replace‏ يمكنه أن يقوم بنفس العمليات الحسابية التي يقوم بها 
generate‏ ولكنه يقوم بتغييرقيم المتغير الموجود Yo‏ من إنشاء متغير جديد. 
فعلى سبيل المثال» إذا افترضنا أنه لدينا بيانات الدخل بالدولار» وقررنا أنه 
من الأفضل العمل مع هذه البيانات بحيث تكون بالآلاف» وللقيام بعملية 
تحويل قيم الدولار إلى آلاف يمكننا التقسيم على 1000: 
.replace income - income/1000‏ 
الأمر replace‏ يمكنه القيام بمثل هذه التغييرات بالجملة» أو يمكن 
استخدامه مع المحددات هذ ifs‏ لتحرير بيانات معينة فقطهء بافتراض أن 
متغيرات المسح تتضمن العمر age‏ وسنة الميلاد born‏ فأمر ستاتا مثل الأمر 
أدناه سوف يقوم بتصحيح واحد أو أكثر من المتغيرات التي تم طباعتها 
بطريقة خاطئة مثل 299 بدلاً من 29 
.replace age = 29 if age == 9‏ 
أو يمكن القيام بنفس الأمر بطريقة أخرى بطباعة الأمر أدناه لتصحيح 
قيم age jall‏ للمشاهدة رقم 1453 
.replace age - 29 in 1453‏ 
وللقيام بذلك هناك مثال أكثر تعقيداً. 


.replace age = 2012-born if missing (age) | ageti 
< 2012-born 


الأمر أعلاه يستبدل ad‏ متغير العمر age‏ بقيمة 2012 مطروحاً منها سنة 
الميلاد born‏ إذا كان العمر age‏ قيمة مفقودة أو إذا كان العمر المعروض (سنة 
الميلاد مضافا إليها 1) أقل من 2012 مطروحا منها سنة الميلاد. 

الأمر generate‏ والأمر replace‏ يُعتير o‏ » ات لإنشاء متغيرات 
تصنيفيّة» فقد لاحظنا سابقا أن البيانات الكندية تتضمن عدة أنواع من 
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المشاهدات (حيث إنها تشمل إقليم ينو 10 ولايات ودولة واحدة) وبالرغم من 

أن المحددين ifs in‏ يسمحان ll‏ بفضل هذه المشاهدات» فإن الأمنر drop‏ 

يمكنه إزالة هذه المشاهدات من البيانات. وربما يعتبر أكثر الأمور سهولة هو 

وضع متغيرات تصنيفيّة توضح نوع المشاهدات؛المثال التالي يوضح طريقة 

إنشاء ha‏ هذه المتغيرات باستخدام ملف بيانات كندا «Canadal:dta‏ ونبداً 

Jia ul) egi gh cian Cte US] T (giga Ca jas type stall بإنشاء"‎ 

هذه القيمة بالقيمة 2 لإقليم يوكون Yukon‏ والأقاليم الشمالية ixl‏ 

Northwest Territory‏ و القيمة 3 لكنداء والخطوات الأخيرة تتضمن توصيف 
المتغير الجديد type‏ وتعريف .التوصيفات للقيم ]6 42 3. 

suse "C:\data\Canadal.dta", clear 

‘generate type = 1 

-replace type = 2 if place == "Yukon" | 

place =="northwest Territories" 

-replace type = 3 if place == "Canada" 

label variable type "Province, territory or 

nation" 

-label define typelb1i =f "Province" 2 


"Territory" 3 "Nation' 
-label values typetypelbi 




























list 
place pop unemp mlife flife vos | 
5. Canada 29606.1 10.6 7591 81.1 Nation 
2 Newfoundland 575.4 19.6 549 79.8 Province 
d Prince Edward Island 136.1 19.1 74.8 81.3 Province 
4. Nova Scotia 937.8 13.9 74.2 80.4 Province 
55 New Brunswick 760.1 13.8 74.8 80.6 Province 
6. Quebec 7334.2 v2 2 Province 
7 Ontario 11100.3 9:3 2555 81.1 Province 
8. Manitoba 1137.5 8.5 75 80.8 Province 
9 Saskatchewan 1015.6 7 2308 81.8 Province 
10. Alberta 2747 8.4 1555, 81.4 Province 
ا‎ aM 
11. British Columbia 3766 9.8 75.8 81.4 Province 
221 Yukon 30.1 A Tisa 80.4 Territory 
13. Northwest Territories 65.8 " 70.2 78 Province 
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كما يظهر في الجدول السابق» فإن توصيف القيم لمتغير تصنيفي يتطلب 
أمرين اثنين» فالأمر label define‏ يحدد ماهي التوصيفات التي ترافق الأرقام» 
والأمر label values‏ يحدد ما هو المتغير الذي تنطبق عليه التوصيفات» إحدى 
مجموعة التوصيفات (والتي تم إنشاؤها بالأمر (label define‏ يمكن تطبيقها على 
أي عدد من المتغيرات الرقمية (وذلك بإضافتها إلى الأمر «(label values‏ 
توصيفات القيم يمكن أن تتضمن 32000 حرف» ولكن من الأفضل ألا تكون 
توصيفات المتغيرات طويلة جداً. 
الأمر AXXa: generate‏ إنشاء متغير ات جديدة» والأمر replace‏ يمكنه 
القيام بتخفيض القيم باستخدام أي خليط من المتغيرات القديمة والثوابت والقيم 
العشوائية والتعبيرات» بالنسبة للمتغيرات الرقمية يجب أن $533 Lele‏ 
الإشارات الحسابية التالية: 
+ جمع 
cob -‏ 
* ضرب 
| قسمة 
oA ^‏ 
الأقواس سوف تتحكم في ترتيب العمليات الحسابية» وبدون اس تخدام 
الأقواس» فإنه سوف يتم اتباع الترتيب المعتاد للعمليات الحسابيةء وبالنسبة 
للعلامات الحسابية» فإن العلامة الوحيدة التي يتم استخدامها مع المتغيرات 
النصية هي علامة الجمع "+" حيث إنها تقوم بدمج متغيرين نصيين في متغير 
واحد. 
وبالرغم من اختلاف أغراض استخدام الأمر generate‏ والأمر replace‏ 
فإنهما متشابهان من حيث التركيبة» Cus‏ إنهما يستخدمان نفس المعاملات 
الحسابية والمنطقية التي يستخدمها ستاتاء كما أنهما يستخدمان المحددين هذ أو 
cif‏ كما أن هذه الأوامر يمكنها استخدام مجموعة من الدوال الخاصة ببرنامج 
cts‏ وی سرت ور Ain Qn à‏ 
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Missing Value Codes : القيم أطفقوده‎ jooj 
الأمثلة التي تم شرحها حتى الآن؛ تتضمن رمز واحدا فقط للقيم‎ 
المفقودة. والقيمة المفقودة يعتبرها ستاتا أعلى قيمة عند ترتيب القيم من أقل‎ 
فإن وجود القيم المفقودة في بعض‎ ale قيمة إلى أكبر قيمة. وبصفة‎ 
ويمكننا استخدام عدة أنواع من الرموز لتمشل‎ cae البيانات ترجع لأسباب‎ 
القيم المفقودة» وذلك بإضافة امتداد لرموز القيم المفقودة» وهذه القيم المفقودة‎ 
بامتداد سوف يعتبرها ستاتا قيماً كبيرة عند ترتيب البيانات من أعلى قيمة إلى‎ 
كما أن‎ "z^ إلى‎ “a القيم المفقودة من‎ cali ji يتم‎ Ch gus Sad قيمةء‎ Jal 
رموز القيم المفقودة بامتداد يمكن أن تتم إضافة توصيف لها على عكس‎ 

الرمز الافتراضي للقيمة المفقودة ”.“ والذي لايمكن إضافة توصيف Al‏ 

تظهر الحاجة إلى استخدام أنواع مختلفة من رموز القيم المفقودة في 
الدراسات الاستقصائية عند استخدام استمارة الاستبيان. فمثلا قد Y‏ نجد إجابة 
لسؤال "في أي سنة تزوجت؟' وذلك GY‏ أحد أفراد العينة لم يسبق له الزواج؛ ولا 
يمكنك أن تتجاهل الإجابات الخاصة بهذا السؤال؛ مستخدما ملف البيانات 
Gills Granite2011_6.dta‏ يحتوي على بيانات من دراسة استقصائية حول 
وجهات النظر السياسية بولاية نيوهامبشير والذي قام به مركز جرانيت لاستطلاع 
الرأي في جامعة هامبشير بالولايات المتحدةء ففي أحد أسئلة الاستطلاع؛ تم سؤال 
أفراد العينة عن مستوى اهتمامهم بالانتخابات العامة لسنة 2012 (genint)‏ 
وسوف نستخدم هذا السؤال لشرح رموز القيم المفقودة بامتداد. 

في البداية يظهر أن مستوى الاهتمام genint‏ واضح» ولكن من الصعب 
القيام ببعض التحليلات الإحصائية مع هذا السؤال: 


-tabulate genint 










Interest in 2012 
pres. election 


extremely interested 


very interested 168 32.56 80.04 
somewhat interested 72 433/95) 93.99 
not very interested 28 5.43 99.42 

don't know 2 0.39 99.81 





no answer 
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يظهر من الجدول أعلاه أن القيم الأربع. الأولى تمثل مقيساس: الاهتمامء 
وتم تو qiza‏ من "مهتم للغاية" "extremely interested"‏ إلى *not serons ox‏ 
«very interested" :‏ أما آخر قيمتين el 5 ed‏ 3 ف" “don’t know"‏ و Y"‏ إجابة 4" "no.‏ 
answer"‏ وهاتان الإجابتان. لايمثلان جزءًا من مقياس الاهتمام؛ وإ Lal‏ هما E‏ ع 
من .عدم الإجابة. مركز .جرانيت لاستطلاع الرأي يستخدم Uli f‏ خاصة في 
cabal jal à‏ الاستقصائية لتمثل. جدة أنواع من pre.‏ الإجابة. وفي مثالنا.هذاء فإن 
الرقم 8 .يعني أن المشارك في الدر اسة قد ola TW,‏ مستوى PEN‏ 
٠‏ في حين .أن الرقم 99 يعني Ada V‏ تم ne]‏ ها i s kc gull‏ ن ,تز edis‏ 
ail.‏ الرقمية إذا PETENTE ARES ont‏ 


e genint, Dé 


Interest in 
2012. pres. ^ 2. 
election p Freq. , Percent . , Cum, 





أي حسابات إحصائية genint A‏ لن تكون دقيقة» وذلك بسبب 352.5 
الرقمين 98 5 99 فمثلاً لمعرفة المتوسط الحسابي للمؤهلات العلمية لأفراد 
العينة للمتغير egertint‏ فإن ذلك سوف يكون عديم النفع» وذلك GY‏ القيمتين 
8 و99 تم تضمينهما في حساب المتوسط الحسابي. 


.tabulate educ, summarize (genint) 


Highest Summary of Interest in 2012 pres. 
degree election 
completed Mean Std. Dev. Freq. 
HS or les 2.8275862 8.9668722 116 
Tech/some 35,5 12.451587 120 
College g 1.672956 .82290667 159 
Postgrad 1.5775862 . 80380467 11s 


Total | 2.3424658 7.4366697 511 
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هناك حاجة للحصول على نسخة مطورة من الجدول السابق» وسوف 
نسميها gata‏ الجديد cgenint2‏ والشنكل Saal‏ للجدول,سوف يكون Libia‏ 
عن السابق» وذلك لثلاثة أسباب هي: 
أولاً: سوف نعكس القيم من 1 إلى 4» بحيث إن القيم الأعلى تشير إلى اهتمام 
أكبر Ya‏ من اهتمام أقل» وهذا يجعل عملية التفسير منطقية أكثر. 
generate genint2 = 5 - genint if genint<90‏ 
ثانياً: cia dla UE WET uai 99 , 8 E‏ ولن يكم iaces‏ في 
حسات المتوتبط الحسابي؛ والحتتابات'الإخضّائية cg AME‏ لذلك Cà sa‏ 
نستخدم رمز القيمة المفقودة a‏ لتمثل “don't know" "c3 el Y"‏ والتي 
تم تمثيلها سابقا بالر مز 98 والرمز b‏ لتمثل "لا إجابة" ^no answer"‏ 
والتي تم تمثيلها سابقاً بالرمز 99 


‘replace genint2 -a if genint == 98 


replace genint2. 


leba genint. == 99. 


PRESA “مرخ استخدامٌ‎ Vaud sun aa iani القيم يمكن‎ cg ua 
C gua التو ضيف‎ OB ell, tel 5 إلى‎ “e extremely interested? "A34 
: Qf FASB الرسو م‎ obras 
-label variable  genint2 "interest in 2012 
election (new)" 55s 
label define genint2 1 "Not very" 2 "Sonewhat" 
3 "Very" : 
4 "Extremely" .a "DK" .b "NA' 
-label values TORPAEATEDARES 


الخطوة الأخيرة المهمة» وهي éd ial me asd‏ الجديدة 
والمتغيرات القديمة للمقارنة بينهما والتأكد من أن جميع الأوامر قد قامت بما 
هو مُفترض. ا 
tabulate genint genint2, miss‏ 
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NS‏ 


Interest in 2012 election (new) 
Not very Somewhat Very Extremely 





Interest in 2012 
pres. election 















Total 


extremely interested 245 
very interested 168 
somewhat interested 72 
not very interested 28 
don't know 
no answer 
516 


Interest in 2012 
election (new) 
DK 


Interest in 2012 
pres. election 





NA Total 


extremely interested 245 
very interested 168 
somewhat interested 72 
not very interested 28 
don't know 2 


no answer 


بعد إجراء هذه التعديلات؛ فإن هذا المتغير أصبح SU‏ للتحليل بشكل 
أكثر me‏ من ذي قبل» à‏ فمثلاً أصبح من السهل أن نحدد المتوسط الحسابي 
لمستوى الاهتمام بالانتخابات مع تحديد المستوى التعليمي لأفراد العينة. 


. tabulate educ, summ(genint2) 










Highest Summary of Interest in 2012 
degree election (new) 
completed Mean Std. Dev. Freq. 
HS or les 3 .98229949 115 
Tech/some 3.1101695 .89427331 118 
College g 3.327044 .82290667 159 
Postgrad 3.4224138 .80380467 116 










3.2244094 .88647221 508 





عند التعامل مع أرقام محددة Jiu)‏ 98 و 99 في المثال أعلاه) Gilly‏ 
تشيد. إلى القيم المفقودة» فإنه من الأفضل تغيير رموز القيم المفقودة بالطريقة 
a‏ .ابقة N c‏ يقوم ous‏ بإدخالها ض ضمن أي حسابات إحصائية يمكن 
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بسهولة القيام بذلك لجميع المتغيرات» وذلك باستخدام الأمر Wied mvdecode‏ 
يمكن إعطاء الأمر. 
genintincomeage,mv(97=.\98=.a \99=.b)‏ 11706006 
الأمر أعلاه سوف يغير أي قيم للمتغيرات age «income «genint‏ من 
7 إلى ”.“ ومن 98 إلى “a”‏ وهكذاء القيم من ه. و 5. (حتى القيمة eS (z‏ 
مفقودة 5-9 إدخال توصيف لهاء ولكن لايمكن إدخال توصيف لرمز القيمة 
المفقودة ”.“. وكما هو معتادء فإن هذه التعديلات التي تم القيام بها لاتصبح 
ido‏ حتى يتم dis‏ البيانات» ومن الأفضل حفظها في ملف باسم جديد 
كإجراء احتياطي» فريما قد نحتاج إلى العودة إلى البيانات الأصلية مستقبلاً 
لأي سبب من الأسباب. 


Using Functions : استخدام الدوال‎ 


هذا الجزء يعرض قائمة بالعديد من الدوال المتوافرة me‏ مع الأمر 
generate‏ والأمر creplace‏ فعلى سبيل المثال» يمكننا إنشاء متغير جديد 
doginc awl‏ وهو يساوي اللوغاريتم الطبيعي للمتغير income‏ وذلك 
باستخدام Alla‏ اللوغاريتم الطبيعي In‏ مع الأمر LS generate‏ يلي: 
generate loginc = 1n(income)‏ 
In Alla‏ هي واحدة من الدوال الرياضية في برنامج ستاتاء AB)‏ 
الأخرى تتضمن logl0(x)‏ للوغاريتم طبيعي أساسه 10« int(x)‏ للعدد 
الصحيح exp(x) «x‏ وهي عبارة عن e‏ مرفوعة للأس e) x‏ تساوي تقريباً 
8 وهناك العديد من الدوال الأخرى. وللحصول على قائمة 
كاملة بتفاصيل هذه «UI sall‏ قم بطباعة الأمر -heip math functions‏ 
وهناك Gaf‏ العديد من دوال الكثافة الاحتماليةء ويمكنك الحصول على 
قائمة كاملة بهذه الدوال بطباعة الأمر help density functions‏ أو من خلال 
الاطلاع على دليل المستخدم لبرنامج ستاتاء حيث تحتوي قوائم هذه الدوال 
على تعريفات لهذه الدوال» وتركيب معاملاتهاء وكيفية تعاملها مع القيم 
المفقودة. فعلى invnormal(p) Alla «Gall Juu‏ تعطي التوزيع الطبيعي 
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المعياري التراكمي أو قيمة ‏ المرتبطة بدرجة الاحتمال ep‏ وتتضمن gall‏ 
الأخرى قيمة بيتاء والتوزيع (GUI‏ ومربع lS‏ واختبار of‏ واختبار CF‏ 
وتوزيع جاماء والتوزيعات المنتظمةء وهناك Alla‏ أخرى. مهمة جدا.خاصة 
بالمحاكاة وهي runiform()‏ وتستخدم لإنشاء الأرقام شبه العشوائية وذلك 
لاستخراج القيم من التوزيعات المنتظمة» وهذه القيم نظرياً تكون في نطاق 
بين 0 و1 تقريباً وتكتب على الشكل (0,1]. 

برنامج ستاتا يعرض العديد من دوال التواريخ» وكذلك التواريخ التي 
تتعلق بدوال السلاسل الزمنية» وخاصة تلك التي لها تنسيقات خاصة في 
العرض أو المتغيرات التي تتعلق بالتواريخ؛ ويمكن الحصول على قائمة 
بتفاصيل تلك الدوال من دليل المستخدم الخاص ببرنامج ستاتا أو بطباعة 
الأمر thelp date functions‏ دوال التاريخ في العادة تتضمن تواريخ 
ماضية» والتي تشير إلى عدد الأيام Xa‏ 1 يناير 1960م: 

بيانات درجة الحرارة العالميةء ولتي d‏ الإشارة إليها Gha‏ فى هذا 
الفصل» تعتبر كمثال للتواريخ الماضيةء حيث يحتوي ملف البيانات على 
بيانات year à Aul‏ والشهر h‏ 7 ولكن لا يوجد متغیر واحد يتضمن بيانات 


suse C: ديا‎ gums clear 
.describe à Sor 


Contains data from C:\data\globall.dta 


obs: 4 1,584 ` Global climate ~ 

vars: 3 4 Jul 2012 11:21 

sizez< } 11.088 

storage display value 

variable rame type format label variable label 
year int %8.0g Year 
month byte $8.09 1 Month 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 
Sorted by: 


٠‏ يمكننا إنشاء متغيز جديد اللتازيخ الماضي يسمى edate‏ باستخدام دالة 
mdy‏ وهي Anal ces e.‏ للحنروف الأولئ للكلمات Ue‏ ويوم 
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وسنة œ «month, day, year)‏ احتساب متوسط الحرارة الشهري لبياننات 
درجات الحرارة العالمية في المثال أعلاه» لذلك فمن الممكن استخدام اليوم 
5 من كل شهر (المدخل البديل هو استخدام بيانات شهرية - انظر إلى 
شرح بيانات الملف Climate.dta‏ في الفصل 12) وحيث إن edate‏ يمثل عدد 
الأيام منذ 1 يناير 1960ء لذا فإن عدد الأيام قبل هذا التاريخ سوف تظهر 
بإشارة سالبة. 

-generate edate - mdy(month, 15, year) 


-label variable edate "elapsed date' 
-list in 1/5 


temp edate 


.0623 -29205 
.1929 -29174 
.1966 -29145 
.0912 -29114 
-.151 -29084 


Ur C No B 





ويمكن أن تكون النتيجة أكثر وضوحاً إذا قمنا بتنسيق بيانات المتغير edate‏ 
كمتغير يمثل تاريخ (%td)‏ يعرض الشهر (m)‏ والقرن (C)‏ والسنة (Y)‏ ثم نقوم 
بتوصيف القيم الرقمية للمتغير edate‏ ونعطيها وصف ”1880 “Jan‏ 
-format edate ?;tdmCY‏ 
list in 1/5‏ 


year month temp edate 


Jani1880 
Feb1880 


Mar1880 
Apr1880 
May1880 


شرا QOIS‏ ص ف 





أخيراً نقوم بحفظ البيانات save‏ مع المتغير الجديد» وبإنشاء رسم بياني 
لدرجة حرارة العالم السنوية temp‏ مع المتغير Uu edate‏ الحصول على 
فكرة عن التغير خلال الفترة الزمنية. 


-Sort yearmonth 
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.order year month edate 
.save C:\data\glbal12.dta, replace 
-graph twoway line temp edate 


1 
جد 


5 
= 


NCDC global temp anomaly vs 1901-2000, C 
-.5 0 
1 


5 
Lh» 





1 


0 
—— r 


T T 
Jani880 Jan1900 Jan1920 Jan1940 Jan1960 Jan1980 Jan2000 Jan2020 
elapsed date 


الشكل )1.2( 


الأنواع الأخرى من الدوال تتضمن دوال المصفوفات» ودوال الأرقام 
العشوائية» ودوال النصوصء ودوال السلاسل الزمنية» ودوال البرمجة؛ قم 
بطباعة الأمر le gia help‏ بأي نوع من أنواع الدوال لمشاهدة تفاصيل كل 
نوع من أنواع «UI gall‏ كما يقوم دليل المستخدم لبرنامج ستاتا بعرض أمثلة 

أكثر تفصيلا عن هذه الدوال. 
دوال متعددة وعوامل أخرى يمكن استخدامها مع أي أمر حسب الحاجة» 
والدوال والعوامل الرياضية الأخرى التي سبق شرحها سابقاً يمكن أيضنا 
استخدامها بطريقة أخرى بحيث لا تقوم بإنشاء أو تعديل أي متغيرات» الأمر 
display‏ يقوم بحساب وعرض النتائج على الشاشة» فمثلاً: 
.display 2+3 o‏ 
5 
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الف ال ا ا € M‏ 


-display 10g10(10^83) 

83 

display invttail(120, .025) * 34.1/sqrt(975) 
2.1622305 


لذا فإن الأمر display‏ يمكن استخدامه لعرض الحسابات الإحصائية على 
الشاشة على خلاف الأوامر replace ; generate.‏ والتي تقوم بإجراء تغييرات 
مباشرة في النتائج الإحصائية. ولتوضيح ذلك» نعود لبيانات الجليد في القطب 
الشمالي» والتي تم شرحها في الفصل الأول من هذا الكتاب cArctic9.dta‏ أحد 
المتغيرات extent‏ والذي يمثل متوسط المنطقة المغطاة بالجليد بذ Ape‏ 7615 
على الأقل خلال شهر سبتمبر في كل Aia‏ (تم إظهارها في رسم دباني بالشكل 
1.1(« فخلال 33 سنة من مشاهدات الأقمار الصناعية»؛ متوسط المنطقة 
المغطاة بالجليد كان نحو 6.52 مليون كيلومتر مربع. 
-summarize extent‏ 
Variable Obs Mean Std. Dev. Min Max‏ 


extent 33 6.51697 9691796 4.3 7.88 


بعد الحصول على الملخص أعلاه» فإن ستاتا يقوم بحفظ المتوسط 
الحسابي كمتغير كمي r(mean) eb‏ 


-display r(mean) 
6.5169697 


يمكننا استخدام هذه النتيجة لإنشاء متغير ana‏ باسم extentÜ‏ والذي 

Cà yx‏ بأنه الانحراف عن متوسط الفترة 1979 - 2011« extentü‏ سوف 
يكون له تاس الانحراف المعياري الخاص بالمتغير extent‏ ولكن المتوسط 
الحسابي له صفر تقريباًء وهذا يعكس قيمة الانحراف عن المتوسط لكل شهر 
gen extent0 = extent - r(mean)‏ 

-summ extent extent0 


Variable Obs Mean Std. Dev. Min Max 





extent 33 6.51697 .9691796 4.3 7.88 
extent0 33 1.17e-08 .9691796 -2.216969 1.36303 


80 الإحصاء مع برنامج ستاتا 





بعد القيام JS‏ عملية تحليل يقوم برنامج ستاتا بحفظ هذه النتائج مؤقتاً 
مثل r(mean) Bis‏ بعد الأمر summarize‏ هذه الحسابات مهمة fap‏ للتحليلات 
الإحصائية أو البرمجة اللاحقةء ولمشاهدة قائمة ALAS‏ بالأسماء والقيم التي تم 
حفظها قم بطباعة الأمر return list‏ ففي المثال أعلاه القيم المخزنة N)‏ 
r(sum_w) 5‏ و r(mean)‏ تمثل آخر القيم التي قام ستاتا بحفظها في ذاكرته المؤقتة 
للمتغير -extent‏ 


.return list 


scalars: 
r(N) = 33 
r(sum w) = 33 
r(mean) = 1.17403088194e-08 
r(Var) = .9393091848549505 
r(sd) = .9691796452954171 
r(min) = -2.21696949005127 
r(max) = 1.363030433654785 
r(sum) = 3.87430191040e-07 


برنامج ستاتا يوفر كذلك أوامر أخرى لإنشاء المتغيرات؛ فالأمر egen‏ 
(وهو امتداد للأمر (generate‏ له مجموعة من الدوال التي تقوم بعدة مهام 
بطريقة أسرع وأسهل من الأمر «generate‏ وهذه المهام تتضمن إنشاء 
متغيرات جديدة من المجاميع» وأعلى Aad‏ وأصغر Aad‏ ونطاق الربيعاتء 
والقيم المعلمية والترتيبات أو المتوسطات المرجحة للمتغيرات. فعلى سبيل 
المثال» لإنشاء متغير جديد باسم zscore‏ والذي يساوي القيم المعلمية (متوسط 
0« انحراف 1) للمتغير × نعطي الأمر التالي: 
-egen zscore = std(x)‏ 
أو يمكن القيام بإنشاء متغير جديد avg‏ وهو يساوي المتوسط الحسابي 
لصف قيم كل مشاهد: x,y,z, w‏ ويتجاهل أي قيم مفقودة. 
.egen avg - rowmean (x,y,z,w)‏ 
لإنشاء متغير جديد باسم total‏ يساوي مجموع ad‏ الصفوف لكل مشاهدة 
ل y, z, w‏ ,د ويعتبر القيم المفقودة صفر. 
.egen total - rowtotal (x, y, z, w)‏ 
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الأمر التالي يقوم بإنشاء متغير جديد يسمى cxrank‏ والذي يحتوي على 
ترتيب قيم المتغير » Ule‏ بأن 1 = xrank‏ لأعلى قيمة في «x‏ و 2 = xrank‏ 
لثاني أعلى قيمة» وهكذا. 
.egen xrank - rank(x)‏ 
للحصول على قائمة بدوال الأمر egen‏ قم باستخدام الأمر help egen‏ أو 
قم بالبحث في دليل مستخدم برنامج ستاتا للحصول على أمثلة أكثر عن ABS‏ 
استخدام الدالة. 
النحويل بين التنسيقات الرقمية والنصية : 
Converting Between Numeric and String Formats‏ 
الملف Canada2.dta‏ يحتوي على متغير نصي daly‏ يسمى «place‏ كما 
يحتوي على متغير تصنيفي وصفي cope‏ وكلا المتغيرين يحتويان على eS‏ 


suse C:\data\Canada2, clear 
-list place type 


Canada Nation 

Newfoundland Province 

Prince Edward Island Province 
Nova Scotia Province 

New Brunswick Province 


Quebec Province 


Ontario Province 
Manitoba Province 
Saskatchewan Province 
Alberta Province 


British Columbia Province 
Yukon Territory 
Northwest Territories Territory 





تحت التوصيف يبقى المتغير ype‏ متغيرا رقميا ويظهر بخط أزرق في 
نافذة محرر البيانات Data Editor‏ أو نافذة Browser‏ وبالضغط على أي خلية 
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سوف نرى الأرقام» ويمكننا رؤية قائمة بهذه الأرقام باستخدام الأمر nolabel‏ 


كما يلي: 


.list place type, nolabel 


place type 


Canada 

Neurzo2undland 

Prince Edward Island 
Nova Scotia 

New Brunswick 


Quebec 
Ontario 
Manitoba 
Saskatchewan 
Alberta 


British Columbia 
Yukon 
Northwest Territories 





المتغيرات النصية والرقمية التي لها توصيفات تسلك سلوكاً مختلفاً عند 
التحليل. حيث إن أغلب العمليات الإحصائية والعلاقات الرياضية لايمكن 
استخدامها مع المتغيرات النصية» لذلك فإننا قد نحتاج إلى الحصول على 
نسخة نصية ورقمية بتوصيفات لبعض المعلومات في البيانات الموجودة 
لديناء الأمر agi encode‏ بإنشاء متغير رقمي بوصف من متغير نصيء 
الرقم 1 يتم إعطاؤه للحرف الأبجدي الأول للمتغير النصي ورقم 2 للحرف 
الأبجدي الثاني وهكذاء المثال التالي يقوم بإنشاء متغير رقمي وصفي يسمى 
من المتغير النصي place‏ كما يلي: 
.encode place, gen(placenum)‏ 
كما أنه من الممكن القيام بالتحويل العكسيء فالأمر decode‏ يقوم بإنشاء 
متغير نصي باستخدام قيم المتغير الرقمي» فمثلا يمكننا إنشاء المتغير النصي 
typestr‏ من المتغير الرقمي type‏ 
-decode type, gen(typestr)‏ 
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وعند استخراج قائمة بالمتغيرات» فإن المتغير الرقمي الجديد 
و والمتغير النصي الجديد typestr‏ يتشابهان مع المتغيرات 


الأصلية. 
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-list place placenum type typestr 


typestr 









type 
Nation ME 
Province Province 
Province Province 
Province Province 
Province Province 
Province Province 
Province Province 
Province Province 
Province Province 
Province Province 








placenum 


Canada 

Newfoundland 

Prince Edward Island 
Nova Scotia 

New Brunswick 


Quebec 
Ontario 
Manitoba 
Saskatchewan 
Alberta 


place 


~ 
Canada 


Newfoundland 

Prince Edward island 
Nova Scotia 

New Brunswick 


Quebec 
Ontario 
Manitoba 
Saskatchewan 
Alberta 








Province Province 
Territory Territory 
Territory Territory 


British Columbia 
Yukon 


Northwest Territories 


British Columbia 
Yukon 
Northwest Territories 





UD س‎ Oo 









ولكن عند استخدام خيار aolabel‏ فإن الاختلافات تصبح أكثر وضوحاً. 
حيث إن ستاتا يعتبر المتغير placenum‏ والمتغير تر أرقاما. 
-list place placenum type typestr, nolabel‏ 


type 


Nation 
Province 
Province 
Province 
Province 


Province 
Province 


Province 


Province 
Province 


Province 
Territory 
Territory 


place placenum 
die Canada 
2. Newfoundland 
Ste Prince Edward Island 
4. Nova Scotia 
5. New Brunswick 
6. Quebec 
Ls Ontario 
8. Manitoba 
9 Saskatchewan 
10 Alberta 
TE. British Columbia 
12 Yukon 
did Northwest Territories 
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أغلب التحليلات الإحصائية مثل المتوسط الحسابيء والانحرافات 
المعيارية يمكن القيام بها مع المتغيرات الرقمية فقطء لذلك فإن توصيف هذه 
المتغيرات لايعتبر ذا أهمية أثناء إجراء الحسابات الإحصائية. 


-summarize place placenum type typestr 





Variable Obs Mean Std. Dev. Min Max 
place 0 
placenum 13 7; 3.89444 1 13 
type 13 1.307692 .6304252 T 
typestr 0 


أحياناً قد نجد أن قيم أحد المتغيرات النصية في أغلبها أرقاماًء ولتحويل 
هذه القيم النصية إلى نظيراتها الرقميةء يجب علينا استخدام «real lla‏ فمثلاً 
في البيانات أدناه» المتغير النصي siblings‏ يحتوي على ded‏ نصية واحدة 4“ 
or more”‏ والتي يمكن تمثيلها Laj‏ برقم. 


describe siblings 


storage display value 
variable name type format label variable label 
siblings str9 558 Number of siblings (string) 


.list 


siblings 


Uo (ON جو‎ 


4 or more 





.generate sibnum - real(siblings) 


المتغير الجديد sibnum‏ أصبح الآن متغيرا رقميا مع قيمة مفقودة واحدة 
وهي or more"‏ 4“ 
list‏ 
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siblings sibnum 








UPR WNP 


الأمر destring‏ يوفر طريقة أكثر مزونة لتحويل المتغيرات النصية إلى 

متغيرات رقمية» ففي المثال corte}‏ يمكننا إجراء نفس المهام» وذلك بطباعة 
الأمر التالي: 0( 

-destring siblings, generate(sibnum) force 


للحصول على معلومات أكثر حول ترک هذا الأمر وخياراته» اطبع 
الأمر -help destring‏ 


إنشاء متغيرات تصنيفية dwijo‏ جديده : 


Creating New Categorical and Ordinal Variables 





في الجرّء السابق» تم شرح كيفية إنشاء متغير تصنيفي dL, ype‏ 
للتفرقة بين الأقاليم (دو لة أو مقاطعات) (province and nation)‏ في ملف 
البيانات الكندية» ويمكننا أن نقوم بإنشاء متغيرات تصنيفية وترتيبية Goby‏ 
Gane‏ هذا e jall‏ يعطي بعض الأمثلة عن ذلك. 

المتغير. type‏ يحتوي على ثلاثة تصنيفات: 

«tabulate type 









Province, 
territory 
or nation Freq. Percent Cum. 
Province 
Territory 

Nation 


2 15,38 92.31 
7.69 100.00 


86 الإحصاء مع برنامج ستاتا 





بافتراض أننا نريد sale}‏ كتابة المتغير ype‏ ليكون عبارة عن تعبير 
ثنائي أو وهمي ممثل بالقيمتين 0 أو 1ء الأمر tabulate‏ سوف agi‏ بإنشاء 
متغيرات وهمية بطريقة آلية إذا قمنا بإضافة generate JUS‏ إليه. في المثال 
التالي هناك نتائج لمجموعة من المتغيرات type3 stype2 ctype]‏ وکل متغير 
منها يمثل تصنيفا واحدًا من ثلاثة تصنيفات من المتغير ctype‏ 


.tabulate type, generate (type) 


Province, 









territory 
or nation 


Province 
Territory 
Nation 






2 15.38 92.31 


describe 


Contains data from c:\data\Canada2.dta 


obs: 13 Canadian dataset 2 

vars: 1i 18 Apr 2013 19:57 

size: 741 

Storage display value 

variable name type format label variable label 
place str2i 5 Place name 
pop float %9.0g Population in 1000s, 1995 
unemp float $9.0g . % 15+ population unemployed, 1995 
mlife float %9.0g Male life expectancy years 
flife float %9.0g Female life expectancy years 
type float %9.0g typelbl Province, territory or nation 
placenum long $21.09 placenum Place name 
typestr scr9 $95 Province, territory or nation 
typel byte $8.0g type==Province 
type2 byte %8.0g type==Territory 
type3 byte $8.0g type--Nation 
Sorted by: 


Note: dataset has changed since last saved 


-list place type typel-type3 
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Se‏ ا س 


type typel type2 type3 


Canada Nation 

Newfoundland Province 

Prince Edward Island Province 
Nova Scotia Province 

New Brunswick Province 


Quebec Province 
Ontario Province 
Manitoba Province 
Saskatchewan Province 
Alberta Province 


British Columbia Province 


Yukon Territory 
Northwest Territories Territory 





إعادة كتابة المعلومات التصنيفية كمجموعة من المتغيرات الوهميةء 
لايتضمن فقداناً GY‏ معلومات. ففي المثال أعلاه» نجد أن المتغيرات من 
typel‏ إلى el)‏ 3 معاً توضح نفس المعلومات التي يوضحها المتغير 
ype‏ نفسه» وأحياناً يختار المحللون إعادة كتابة المتغيرات القابلة للقياس في 
شكل تصنيفي Fi‏ ترتيبي حتى عند فقد النتائج جز le‏ كبيرًا من المعلومات, 
فعلى سبيل c Sal)‏ المتغير unemp‏ في الملف Canada2.dta‏ يعطلي قياساً 
لمعدل البطالة واستبعاد كندا من البيانات سوف يؤدي إلى أن يكون معدل 
البطالة قي المدى ما بين %7 5 %19.6 مع متوسط حسابي L220‏ 


.summarize unemp if type !=3 


Variable Obs Mean 560. Dev. Min Max 


unemp 10 12.26 4.44877 7 19.6 


عند هذه النقطة إدخال كندا ضمن التحليل يؤدي إلى عدم توافق البيانات» 
لذلك سوف نقوم باستبعادها بالأمر التالي: 

drop if type== 

هناك نوعان من الأوامر يمكن استخدامهما لإنشاء متغير وهمي يسمى 

unemp2‏ يساوي 0 إذا كان معدل البطالة أقل من المتوسط )12.26( ويساوي 
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1 إذا كان معدل البطالة 3a ^ sd‏ يساوي المتوسط وقيمة مفقودة عند 
وجود أي قيمة مفقودة ضمن بيانات المتغير LÍ cunemp‏ الأمر الثاني فهو 
“gl Aga (ad uae‏ يقوم باعتبار القيم المفقودة أعلى القيم 
iie gal‏ ضمن البيانات. 
.generate unemp2 - 0 if unemp« 12.26‏ 
(7]missing values genera ed)‏ 


.replace  unemp2 = 1 if  unemp»- 12.26 & 
imissing (unemp) i 
(5breai changes made) ^" -- > 


ريما نحتاج إلى وضع القيم ضمن مجموعات لتكون متغير قياس» وهذا 
يعني أنه يجب علينا القيام بإنشاء متغير تصبنيفي أو ترتيبي. ويمكن القيبام 
بذلك باستخدام الدالة autocode‏ (انظر last‏ الدوال). والتي تقوم. بوضبع 
متغيرات القياس ضمن مجموعات بشكل تلقائي؛ ولإنشاء متغير ترتيبي جديد 
يسمى. unemp3‏ و الذي. يصنف ab‏ المتغیر unemp‏ ضمن ثلاث SLE pana‏ , 
متساوية العرض ويكون الفراغ يينها من 5 إلى 20 تقوم بطباعة الأمر: 


w. generate unemp3 =. autocode(unemp,3,5,20) 
(2missing values generated) 


يمن udi. clas‏ تعر ض بيانات المتغير الوهمي الجديد Qinemp2)‏ | 
والمتغير الترتيبي, (unemp3)‏ و Libel‏ بقيم يمتغير. القياس الأصلي Junemp‏ 


.list place unemp unemp2 unemp3, 








place unemp unemp2 unemp3 








Newfoundland 
Prince Edward Island 19 
Nova Scotia 13. 

New Brunswick 135 

zu Quebec 


20 
15 
15 










NO من‎ '0 HP Oo 
هر قو مو موا يو‎ 


ii ontario 9.‏ سك 
Manitoba 8.‏ 
Saskatchewan‏ 
Alberta 8 10‏ 

British Columbia 9 10 


E 4 Yukon : . d 
7 Northwest Territories a . 5 


10 
10 
10 [ 






opr س ی‎ 
ooooo 
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استخدام المخفضات الصرعة £w‏ اطتغيرات : | ] 


9 Explicit Subscripts with Variables 








Late‏ تكون هناك بيانات في ذاكرة برنامج ستاتاء فإن هذه البيانبات 
تُستخذم لتعريف متغيرات نظامية محددة» وهذه المتغيرات.تقوم بوصفه تلك 
البيانات» فمثلاً N‏ تمثل axe g gapa‏ المشاهدات n Linky‏ تمشل. Aie‏ 
المشاهدات» Cus‏ إن n-1‏ للمشاهدة. الأولى؛ n-2‏ :للمشاهدة. الثانية:وهكذا 
حتى- المشاهدة :الأخيرة ) N‏ ص )» وإذا قمنا.بطباعة:الأمر أدناهء فإنه يقوم 
. بإنشاء متغير caselD Gow ane‏ وهو عبارة عن رقم كل مشاهدة كما هي 
في ترتيبها الحالي. Ad.‏ 
generate caselD - n.‏ 
ترتيب البيانات هو طريقة لتغيير رقم قيمة كل مشاهدة «on‏ ولكن قيمتها 
في المتغير الجديد case]D.‏ سوف تبقى بدون تغيير» لذلك إذا قمنا بترتيب 
البيانات بطريقة أخرىء فإنه يمكننا bi‏ نعود إلى ترتيبها السابق بطباعة الأمر 
-Sort caseID + ui p‏ 
إنشاء E‏ الأرقام غير e‏ المحددة لكل مشاهدة والتي تقوم 
بترتيب المشاهدات في مراجل مبكرة أثناء العمل على البيانات يمكن أن 
تساعد لاحقاً في إدارة هذه البيانات. 
يمكننا أن نستخدم المخفضات الصريحة مع أسماء المتغيرات لتحديد رقم 
مشاهدة معينة» فعلى سبيل المثال» لعرض المشاهدة الرابعة في بيانات 
درجات الحرارة العالمية global2.dta‏ والثي كانت في أبريل 1880 وكان 
الانحراف في درجة الحرارة °C‏ 0.0912- نقوم بطباعة الأمر: 
-display temp[4]‏ 
091.2 
وبالمثل» فإن remp[5]‏ تعرض المشاهدة الخامسة التي تمثل الانحراف 
في درجة الحرارة في مايو 1880 وهي 0" 151.- 


.display temp[5] 
-.15099999 
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المخفضات الصريحة؛ والمتغير النظامى Lel n‏ علاقة خاصة Laie‏ 
تكرن ياناك Aaa‏ هني مثال Gla ya‏ للسرارة till Aga ill Del‏ 
temp‏ فإن femp[ n]‏ تشير إلى المشاهدة رقم nth‏ أما femp[ n-1]‏ فإنه 
يشير إلى درجة الحرارة السابقة 5 remp[ n*1]‏ يشير إلى درجة الحرارة 
اللاحقةء لذلك فإننا قد نحتاج إلى إنشاء متغير جديد باسم difiemp‏ وهو 
يساوي التغير في temp‏ منذ الشهر الماضي. 

generate diftemp = temp - temp[ n-1] 

الفصل )12( سيدور حول تحليل السلاسل الزمنية» ويشرح بالتفصيل 
هذا الموضوع. 
اسنیراد بيانات à»‏ برام CGS‏ : 


Importing Data from Other Programs 


الجزء السابق قام بشرح كيفية إدخال البيانات وتحريرها في $388 محرر 
البيانات «Data Editor‏ ولكن إذا كانت البيانات مخزنة ومنسقة في ملف 
جداول إلكترونيةء يمكننا فقط نسخ ولصق البيانات في محرر بيانات خال» أو 
يمكن لستاتا القيام باستيراد هذه البيانات من ملف إكسيل مباشرة من خلال 
القائمة كما يلي: 

File > Import > Excel spreadsheet (*.xls; *.xlex) - 

أو يمكن استخدام الأمر import excel‏ وببساطة يمكننا استيراد الورقة 
الأولى في ملف إكسيل المسمى snowfall.xls‏ بطباعة الأمر 
-import excel using C:\data\snowfall.xls, clear‏ 

ولكن الجداول الإلكترونية تحتوي على عناوين وملاحظات» وعناوين 
cue i‏ وورقات متعددة» ورسومات بيانية» وخصائص أخرى تعقد عملية 
استيراد البيانات» ولتقييد عملية استيراد البيانات import‏ لنطاق خاص من 
الخلايا نقوم باستخدام الخيار cellrange()‏ كما أن الخيار sheet)‏ يمكنه 
تحديد الورقة التي تريد استيراد البيانات منها في ملف إكسيلء والخيار 
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firstrow‏ يحدد لبرنامج ستاتا أن خلايا الصف الأول تحتوي على أسماء 
المتغيرات» فمثلاً في الملف إكسيل snowfall. xls‏ الورقة الأولى اسمها 
“Berlin”‏ تحتوي على بيانات تاريخية عن سقوط الثلوج لقرية برلين Berlin‏ 
بولاية هامبشير بالولايات المتحدة والتي تم مناقشتها في بحث Hamilton et‏ 
al. )2003(‏ والبيانات موجودة في النطاق من الخلية AS‏ إلى الخلية «O56‏ 
والعمود 4 يحتوي على أسماء المتغيرات. 


-import excel using C:\data\snowfall.xls, 
sheet ("Berlin") 
cellrange(a4:056) firstrow clear 


بالرغم من أن خاصية استير اد بيانات import excel Jas)‏ تعتبر دقيقة 
نوعاً cle‏ فإن إعداد البيانات وتنسيقها في ورقة إكسيل يجعل العملية أكثر 
cde ya‏ ويسهّل على ستاتا عملية تحليل البيانات» فمثلا إذا كان هناك بعسض 
اورا ايد اا a TE‏ 
تحتيّة " _ " ويجب ألا تحتوي على 
ud "‏ القيم ne Ay‏ قاغات أ 345 برزقفية 
والحروف النصية يجب حذفها من الخلايا بالأعمدة وتمثيلها بمتغيرات رقمية. 
يقوم ستاتا بشكل تلقائي بتحديد ما إذا كانت بيانات كل عمود تمثل متغيرا 
Uy dias Jd;‏ كانت il ui) o nl dta‏ رن Hia di‏ 


سوف يعتبر ذلك العمود يحتوي على بيانات متغير نصي» « s‏ ةا يعني أن 
الحسابات الإحصائية مثل المتوسط الحسابي» والارتباط لن تكون ممكنة مع 
هذا المتغير النصيء وإذا كانت أغلب القيم هي قيم did)‏ فيمكننا إنشاء 
متغير رقمي جديد (وجعل قيمه النصية كرموز للقيم المفقودة) باستخدام دالة 
real()‏ 
generate newvar - real(oldvar)‏ 
وبالمثل» فإننا قد نحتاج إلى القيام بهذه العملية عند نسخ ولصق بيانات في 
محرر البيانات Data Editor‏ وقبل اختيار البيانات المراد نسخهاء فإننا قد نحتاج 
إلى 22053 ملف إكسيل الذي يحتوي علو هذه البيانات. إحدى الطرق السهلة 
للقيام بذلك هي إدراج صف لأسماء المتغيرات في أعلى البيانات بملف إكسيل 
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ثم نسخة البيانات» بما في ذلك صف أسماء المتغيرات واستخدام لصق خاص 
Paste Special‏ مع خيار معاملة الصف الأول slats‏ للمتغيرات Treat first‏ 
tow as variable names‏ وذلك لوضع كل البيانات في محرر بيانات خال. 


ظريقة ملف das)‏ ومحرر البياناث Data Editor‏ هي طريقة سنهلة 
وسريعة ولكن بالنسبة للبيانات الكبيرة» فإنه من الضروري أن تكون هذه 
البيانات محفوظة بواسطة برامج إحصائية أخرى Sie‏ ملفات SAS.‏ أو SPSS‏ 
أو (lly SAS XPORT‏ يمكن استيراد بياناتها من خلال اختيارات قائمة ستاتا 
File » Import < SAS XPORT‏ 
ge‏ . باستخدام الأمر «import sasxport‏ كما أن تنسيقات البيانات الأخر T;‏ 
يمكن قراءتها باستخدام: ملفات نصية وسيطة أو ترجمتها مباشزة باس تخدام 
برامج خاصة. 
بالإمكان شرح طريقة الملفات 'النصّية باستخدام السلاسل الزمنية للمناخ» 
فالتردد الجنوبي إلنينيو (سوف يتم اختصارها (ENSO‏ همي ظاهرة مناخية 
شبه دورية تحدث في المنطقة الاستوائية بالمحيط الهادئ» ولكنها Lead‏ تؤثر 
على المناطق الأخرىء ويتم تفسير ol gal‏ المنطقة الاستوائية بالمحيط الهادئ 
من خلال مؤشر ENSO‏ المتعدد والذي يتضمن ستة متغيرات (الضغط على 
مستوى البحرء رياح السطح الجنوبية والإقليمية» سطح البحر ودرجة حرارة 
هواء سطح البحرء والسحاب) يتم دمجها في مؤشر واحد ل ENSO‏ الملف 
النصي MELraw‏ يحتوي على قيم شهرية لمؤشر ENSO‏ للفترة من يناير 
1950« وحتى ديسمبر 2011» وهذه القيم تم فصلها باس تخدام مفتاح «tab‏ 
وفاصلة لملف نصي تمت كتابته بواسطة أحد برامج الجداول الإلكترونية» 
الصف الأول من النص يحتوي على قائمة بأسماء المتغيرات وهي: mei]‏ 
لقيمة المؤشر خلال شهر mei2 + ply‏ لقيمة المؤشر خلال شهر فبراير .وهكذا 
(في الواقع فإن قيمة المؤشر لشهر يناير تمثل ديسمبر - ينايرء وقيمة المؤشر 
لشهر فبراير تمثل يناير — فبراير وهكذا) الصفوف الأولى من الملف النصي 
تظهر كما يلي: 
"er "iss "i dan im wi kim i Mi EU ki‏ = ر 1950 
a „434 -.264 .48  .756 864779752 .46‏ .1- 1.194- 1.068- 191 


7 
1952  .400 .12  .09 38 -.257 1.633 -35 -AY um 311 38 1,125 
153  .04  .38 22 02 .83 2M 4n 252 522 2.09  .049 3 
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يمكننا قراءة هذه البيانات باستخدام ستاتا عن طريق الأمر insheet.‏ مع 
خيارات لتحديد أن all‏ تم فصلها باستخدام مفتاح tab‏ وأن الصف الأول يحتوي 
على أسماء المتغيرات. وبعد قراءة بيانات الصفوف» يمكننا حفظ الملف بتنسيق 

ستاتاء وسوف نقوم بتسميته ©/1/510.4 وسوف نستخدم هذا الملف لاحقاً. 
-insheet using c:\data\MEI.raw, tab name clear‏ 
-Save c:\data\MEIO.dta, replace‏ 








-describe 
Contains data from c:\data\MEIO.dta 
obs: 62 
vars: 13 29 Apr 2013 17:01 
size: 3,100 
storage display value 
variable name type format label variable label 
year int $8.0g 
meil float %9.0g 
mei2 float %9.0g 
mei3 float %9.0g 
mei4 float %9.0g 
mei5 float %9.0g 
mei6 float %9.0g 
mei7 float %9.0g 
mei8 float %9.0g 
mei9 float %9.0g 
meil0 float %9.0g 
meill float %9.0g 
meii2 float %9.0g 
Sorted by: 


بإضافة الخيأر Ya comma‏ من insheet y tab‏ يمكن § bel‏ ملف نصي 
يحتوي على ad‏ بينها فواصل» وهذا النوع من الملفات النصية هو TRENT‏ 
الأكثر شيوعاً لمخرجات الجداول الإليكترونية» ويمكن أيضا قراءة الملفات 
النصية باستخدام قوائم برنامج ستاتاء ولمشاهدة الخيارات المتوافرة قم باختيار 
-Data » Import‏ 


حتى الآن الأمثلة التي تم شرحها افترطإت أن قيم البيانات, تم فصلها عن 
يها را و ماع Sa‏ ارو الاي CLE‏ 





94 الإحصاء مع برنامج ستاتا 





تنسيق العمود الثابت fixed-column format‏ حيث تكون البيانات غير 
مفصولة بعلامات معينةء ولكنها تقع في مواقع أعمدة محددة elinaa‏ ومثل هذا 
النوع من الملفات يمكن قراءته باستخدام الأمر dnfix‏ حيث يجب علينا أولاً 
تحديد كيفية قراءة الأعمدة. 


فعلى سبيل المثالء لدينا بيانات مخزنة بملف نصي من نوع (ASCH)‏ 
تحت اسم nfresour.raw‏ 


40 1985# 
198744 
198825138637481086 
198925358964371140 
8615731195 1990 
7930001262 1991 
البيانات أعلاه تتعلق بإنتاج الموارد الطبيعية في نيوفوندلاند بكنداء 
المتغيرات الأربعة تقع في مواقع أعمدة ثابتةء فالأعمدة من )1 — 4( SAG‏ 
السنة )1986 .. 1991(« الأعمدة من 5 — 8 حجم إنتاج الغابات بالمتر 
المكعب بالآلاف )2408 ... قيمة مفقودة)» الأعمدة من 9 - 14 حجم إنتاج 
المناجم بالدولار بالآلاف (764,169 .. 793,000) أما الأعمدة من 15 - 
8 فإنها مؤشر أسعار المستهلكين» ففي سنة 1986 كان المؤشر 1000 وفي 
سنة 1991 كانت قيمة المؤشر 1262ء يجب ملاحظة أن الفراغات في 
تنسيق الأعمدة السابقة تعني وجود قيم مفقودة؛ كما أن البيانات لاتحتوي على 
أي فواصل عشرية. ولاستيراد بیانات nfresour.raw‏ داخل برنامج ستاتا يجب 
علينا تحديد موقع عمود كل متغير كما يلي: 
-infix year 1-4 wood 5-8 mines 9-14 CPI 15-18‏ 


using "C:\Data\nfresour.raw", clear 
.list 


year wood mines CPI 


764169 1000 
743000 1044 
863748 1086 
896437 1140 
861573 1195 


مم زج نا حي صن 


o 


è 793000 1262 
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التنسيقات الأكثر تعقيداً من الأعمدة الثابتةء قد تتطلب قاموس بيانات» 
وقواميس البيانات يمكن أن تكون واضحة وصريحة وبها العديد من 
الاختيارات» ولمعرفة المزيد من المعلومات عن هذه الخيارات» قم بطباعة 
الأمر chelp import‏ ولمزيد من الأمثلة والشرح يمكنك الرجوع إلى دليل 
مستخدم برنامج ستاتا؛ ويمكن لبرنامج ستاتا أيضا استيراد بيانات من قواعد 
البيانات cODBC‏ وللحصول على معلومات أكثر عن ذلكء قم بطباعة الأمر 
-help odbc‏ 
ولكن ماذا ]13 US‏ نريد بيانات من برنامج ستاتا لاستخدامها في برامج 
أخرى؟ يمكن القيام بذلك عن طريق الأمر export excel‏ والأمر export‏ 
sasxport‏ كما أن قوائم ستاتا توفر العديد من الاختيارات وذلك من خلال 
File > Export > Excel spreadsheet (*.xIs; * xlsx)‏ 
File > Export > SAS XPORT‏ 
الأوامر أعلاهء سوف تقوم بإنشاء ملفات إكسيل أو ملفات SAS‏ 
P07‏ كما يمكن Lal‏ إنشاء ملفات نصية بتنسيقات مختلفة عن طريق 
الأمر outsheet‏ والأمر outfile‏ (أو من خلال القائمة «(Data > Export‏ 
الخيار الآخر الأكثر سرعة هو نسخ البيانات من نافذة محرر البيانات 
Data Editor‏ أو نافذة متصفح البيانات Data Browser‏ ببرنامج ستاتا ولصقها 
مباشرة في برنامج الجداول الإليكترونية مثل برنامج إكسيل؛ وفي الغالب فإن 
أفضل خيار هو نقل البيانات مباشرة بين الملفات المخزنة ببرامج إحصائية أو 
قواعد بيانات متخصصة:؛ وهناك بعض البرامج الأخرى التي قد تقوم بتحويل 
البيانات إلى صيغ مفهومة للبرامج الإحصائيةء فمثلا برنامج ستاتا ترانسفير 
Stata/Transfer‏ تقوم بتحويل البيانات إلى تنسيقات مختلفة منها dBASE,‏ 
Excel, FoxPro, Gauss, JMP, MATLAB, Minitab, OSIRIS, Paradox,R,‏ 
«S-Plus, SAS, SPSS, SYSTAT, Stata‏ حتى قواعد البيانات الكبيرة التي 
تحتوي على كمية ضخمة من البيانات يمكن تحويلها بسرعة مع 
cStata/Transfer‏ وهذا البرنامج متوافر من شركة ستاتا StataCorp‏ 
(www.stata.com)‏ 5 من خلال صانع البرنامج وهو Circle Systems‏ 
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«(www.stattransfer.com)‏ وبر أمج تحويل البيانات ضرورية عند العمل مع 
عدة برامج لتبادل البيانات مع الآخرين. 
إحدى المميزات المهمة لبرنامج ستاتاء والتي يجب الإشارة إليها هي أن 
أي ملفات يتم حفظها ببرنامج ستاتا في أنظمة التشغيل المختلفة (سواء كانت 
Mac . Windows‏ أو (Unix‏ فإنه بالإمكان فتحها ببرنامج ستاتا بدون 
الحاجة إلى تحويلها لتلائم نظام تشغيل معين» ولتحويل ملف بيانات تم حفظه 
بإصدار سابق من بر نامج ستاتا إلى أحدث إصدارات ستاتا يجب اس تخدام 
الأمر Yas saveold‏ من استخدام الأمر save‏ أو استخدام قوائم ستاتا واختيار 
File > Save As > Save as type > Stata 9/10 Data‏ 
»& ملفين Uu»‏ أو أكثر : Combining Two or More Stata Files‏ 
بشكل عام» يمكننا دمج ملفات ستاتا بطريقتين: إرفاق append‏ ملف 
البيانات الثاني» والذي يحتوي على المشاهدات الإضافية أو دمجه merge‏ مع 
الملف الذي يحتوي على المتغيرات أو القيم الجديدةء فمثلا الملف lakewin1.dta‏ 
يحتوي على بيانات عن بداية ذوبان الجليد في أكبر بحيرة (بحيرة 
وينيبسوكي) بولاية هامبشير بالولايات المتحدة» وهذه البيانات تم تسجيلها 
بواسطة المواطنين القاطنين لمدة 121 سنة في فترة تمتد من 1887 إلى 


. use c:\data\lakewinl.dta, clear 
describe 
Contains data from c:\data\lakewinl.dta 

obs: 121 Lake Winnipesaukee ice-out 1887-2007 
vars: 3 2 Jul 2012 06:11 
size: 726 
storage display value 

variable name type format label variable label 
year int Sty Year 

winedate * int Stdcyma Lake Winnipesaukee Ice-Out 
winout int $9.0g Lake Winnipesaukee Ice-Out day 


Sorted by: year 
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ee 


.list in -4/1 


year winedate winout 


118. 2004 2004Apr20 
119. 2005 2005Apr20 
120. 2006 2006Apr3 
121. 2007 2007Apr23 





من الجدول أعلاهء نجد أنه في سنة 2007 بدأ ذوبان الجليد في البحيرة 
في 23 أبريلء وهو اليوم 113 من السنة. 

الملف takewin2.dta‏ يحتوي على بيانات جديدة للفترة ما بين 2008 
إلى 2012» وهو يحتوي على نفس المتغيرات بنفس التنسيق» لذا يمكننا دمج 
وتحديث الملف lakewin2.dta‏ مع البيانات الجديدة الموجودة في الملف 
dakewinl.dta‏ باستخدام الأمر append‏ كما يلي: 


‘use c:\data\lakewin2.dta 
(Lake Winnipesaukee ice-out 2008-2012) 


1 
-describe 
Contains data from c:\data\lakewin2.dta 

obs: 5 Lake Winnipesaukee ice-out 2008-2012 

vars: 3 2 Jul 2012 06:11 

size: 30 

storage display value 

variable name type format label variable label 
eee 
year int Sty Year 
winedate int stdcyma Lake Winnipesaukee Ice-Out 
winout int $9.0g Lake Winnipesaukee Ice-Out day 


Sorted by: year 


.list 


year winedate winout 


2008Apr23 
2009Apr12 
2010Mar24 
2011Apr19 
2012Mar23 


مم زح س Qoa‏ 
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.append using c:\data\lakewinl 

.sort year 

.label data "Lake Winnipesaukee ice out 1887- 
2012" 

.save c:\data\lakewin3 

elist in -7/1 


year winedate winout 


120. 2006Apr3 
121. 2007Apr23 
122. 2008Apr23 
123. 2009Apr12 
124. 2010Mar24 


125. 2011Apr19 
126. 2012Mar23 





في هذا المثال البيانات في الملفين الاثنين لها نفس المتغيرات بالرغم من 
أنه ليس من الضروري للثمر append‏ أن يحتوي الملفين على نفس 
المتغيرات» فإذا وجدت هناك متغيرات في ملف واحد ولم توجد في الملف 
الآخرء فإن البيانات المضاف إليها سوف تعتبر البيانات غير الموجودة قيماً 
مفقودة عند إجراء عملية الإرفاق. 


الأمر append‏ : يشبه إلى حد ما ورقة طويلة تحتوي على بيانات تم 
إلصاق ورقة أخرى في أسفلها تحتوي على Gilly‏ جديدة» وبذلك يزيد طول 
الورقة. وهذا يعني إضافة مشاهدات جديدة للمتغيرات: أما الأمر دمج 
merge‏ ففي أبسط أشكاله يشبه إضافة ورقة جديدة على يمين الورقة الجديدة: 
ويزيد عرض الورقةء وهذا يعني إضافة متغيرات جديدة للبيانات. 

الملف lakesun.dta‏ : يحتوي على بيانات ذوبان الجليد لثاني S8‏ 
بحيرة - بحيرة سنابي - بولاية نيوهامبشير خلال الفترة من 1869 إلى 
2012 وبالرغم من أن بيانات أكبر بحيرة «(lakewin3.dta)‏ وبيانات ثاني 
أكبر بحيرة (lakesun.dta)‏ تم الحصول Legale‏ من مصادر مختلفة فإنهما 
يمثلان سلسلة بيانات Ay gis‏ يمكن بسهولة دمجهما في ملف بيانات cadal y‏ 
وذلك باستخدام الأمر merge 1:1 year‏ 
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LL‏ ي ا 


use c:\data\lakesun.dta 


.describe 
Contains data from c:\data\lakesun.dta 
obs: 144 Lake Sunapee ice-out 1869-2012 
vars: 3 2 Jul 2012 06:11 
size: 1,152 
storage display value 
variable name type format label variable label 
year int Sty Year 
sunedate float %tdcymd Date Lake Sunapee Ice-Out 
sunout int $9.0g Lake Sunapee Ice-Out day 


Sorted by: year 


merge 1:1 year using c:\data\lakewin3.dta 





Result * of obs. 
not matched 18 
from master 18 (_merge==1) 
from using 0 ( merge--2) 
matched 126 ( merge--3) 


كلا ملفي البيانات تم ترتيبهما حسب السنة» وإذا لم يكن هذا هو الوضع 
فيجب علينا أن نقوم بالترتيب حسب السنة sort year‏ قبل إجراء عملية 
الدمج؛ نتائج الدمج توضح أن هناك 126 سنة في كلا الملفين (يجب ملاحظة 
أن البيانات الموجودة في ذاكرة ستاتا الآن هي بيانات الملف الرئيس 
«(lakesun.dta‏ والبيانات المستخدمة في عملية الدمج كانت من cà Ll‏ 
المصدر «lakewin3.dta‏ وهناك 18 سنة إضافية )1869 إلى 1886( فقط 
موجودة في الملف akesun.dta‏ لذلك فإن متغيرات بحيرة وينيبسوكي (أكبر 
بحيرة) سوف تحتوي على قيم مفقودة odel‏ السنوات» ويقوم الأمر merge‏ 
بإنشاء متغير merge aal‏ وهو يسجل ما إذا كانت المشاهدات تم الحصول 
عليها من الملف الرئيس فقط «Cmerge=1)‏ أو أن البيانات تم الحصول عليها 
من الملف المصدر «Cmerge=2)‏ أو أن البيانات من كلا الملفين 
«(_merge=3)‏ وهناك خطوة مهمة las‏ وهي معاينة القيم المدمجة ومراجعتها 
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بعناية بعد كل عملية دمج» وذلك للتأكيد على أن كل شيء تم حسب ما هو 
مخطط؛ وقبل القيام بعملية دمج أخرى يجب استبعاد drop‏ أو إعادة تسمية 
rename‏ المتغير الجديد merge‏ وذلك كما يلي: 


-drop merge 
.sort year 
.list in 1/4 


sunedate sunout winedate winout 


1869May9 


1870May9 
1871Apr11 
1872May2 


PWN 





.list in -4/1 


year sunedate sunout winedate winout 


141. 2009Aprli 101 2009Apr12 
142. 2010Apr3 93 2010Mar24 
143. 2011Apr21 LEAL 2011Apr19 
144. 2012Mar22 82 2012Mar23 





-label data "Sunapee & Winnipesaukee ice out 
1869-2012' 
-save c:\data\lakesunwin.dta, replace 


في هذا المثال lid‏ باستخدام الأمر merge‏ لإضافة متغيرات جديدة 
bl.”‏ وذلك بمقارنة المشاهدات مع السنة cyear‏ وبشكل افتراضي فإنه 
عند وجود نفس المتغيرات في ملفي بيانات» فإن البيانات الموجودة في الملف 
الرئيس تبقى كما هي» ويتم إهمال البيانات الموجودة في الملف المصدر. 
وهناك عدة خيارات يمكن استخدامها مع الأمر merge‏ والتي يمكن أن تعتل 
الوضع الافتراضي عند دمج البيانات» فمثلاً الأمر olif‏ يسمح باستبدال أي 
قيمة مفقودة في الملف الرئيس بأي قيمة موجودة في الملف المصدر (ملف 
البيانات هنا 44.4 (newdata.dta‏ 
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emerge 1:1 year using newdata.dta, update‏ 
أو يمكن استخدام أمر آخر يقوم باستبدال أي قيمة في الملف الرئيس بأي 
قيمة غير مفقودة في الملف المصدرء وذلك إذا كانت قيم الملف المصدر 
مختلفة عن قيم الملف الرئيس. 
emerge 1:1 year using newdata, update replace‏ 
كل هذه الأمثلة توضح كيفية دمج ملف مع ملف آخر )1 إلى 1(« ولكن 
هناك احتمالية لدمج ملف بعدة ملفات أخرى (1 إلى مجموعة) وذلك باستخدام 
الخيار dim‏ أو دمج عدة ملفات بعدة ملفات أخرى بالخيار mum‏ ولمزيد 
من المعلومات والأمثلة عن الدمج» قم بطباعة الأمر help merge‏ وانظفر 
دليل إدارة البيانات «Data. Management Manual‏ كما يمكن القيام بتعديل 
البيانات من خلال قوائم ستاتا باختيار Data > Combine datasets‏ 


Collapsing Data : OU (b 





بعد الحصول على البيانات وترتيبهاء قد نكتشف Gay‏ أن هذه البياتات 
لاتلائم احتياجاتناء أو أن هذه البيانات تحتوي على أخطاءء لحسن الحظ هناك 
العديد من الأوامر التي تسهل عملية إعادة بناء البيانات كما يجب» أسهل 
طريقة للقيام بذلك هي طي البيانات collapse‏ حدث يتم تجميع البيانات في 
مجموعات يتم تعريفها بالمتوسط الحسابي أو الوسيط أو أي مقياس إحصائي 
آخر؛ ولتوضيح ذلك نقوم بالعودة إلى بيانات درجات الحرارة العالمية 
الشهرية في الفترة ما بين يناير 1880 إلى ديسمبر 2011 بالملف 

.)1.2( والتي تم توضيحها بالرسم البياني رقم‎ global2.dta 
‘use c:\data\global2.dta, clear 


-describe 
Contains data from c:\data\global2.dta 

obs: 1,584 Global climate 
vars: 4 4 Jul 2012 11:21 
size: 14,256 

storage display value 

variable name type format label variable label 
year int 58 . و0‎ Year 
month byte $8.0g Month 
edate int S$tdmcY elapsed date 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 


TT ee ee 


Sorted by: edate 
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باستخدام الأمر collapse‏ يمكننا بناء مجموعة ة بيانات بسيطة تتضمن متوسط 
انحراف درجات الحرارة لفترة 132 Aa‏ بزلا QA‏ 1584 شه | فضي 
-collapse (mean) temp, by(year)‏ 


-label variable temp "NCDC annual mean temp 


anomaly, deg ©" 
save c:\data\global_yearly.dta, replace 


: 
describe 
Contains data from c:\data\global_yearly.dta 

obs: 132 Global climate 

vars: 2 30 Apr 2013 15:09 

size: 792 

storage display value 

variable name type format label variable label 
year int $8.0g Year 

temp float %9.0g NCDC annual mean temp anomaly, deg C 


Sorted by: year 


البيانات الجديدة (Sy‏ توضيحها برسم بياني مضلع يشير إلى انحراف 
درجات الحرارة السنوية أعلى أو أقل من المتوسط خلال الفترة من 1901 
إلى 2000. 


ا 


mm 


4 6 


2 


NCDC annual mean temp anomaly, deg C 
-.2 





f 


p | eee 
1860 1900 1920 ` 1940 1960 1980 2000 
Year 


الشكل (2.2) 
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الأمر :collapse‏ يمكنه إنشاء متغيرات ida‏ للحسابات الإحصائية التالية: 


mean 


median 
pi 
p2 
sd 


semean 


sebinomi 
al 
sepoisso 
n 

sum 
rawsum 
count 
Max 
Min 

Iqr 
First 
Last 
Firstnm 


Lastnum 


المتوسط الحسابي (وهو الخيار الافتراضي إذا لم يتم تحديد أي شيء آخر). 
الوسيط 
المئين الأول 

المئين الثاني 

الانحراف المعياري 

الخطأ المعياري للمتوسط (sd/sqri(n)) gian.‏ 

الخطأ المعياري للمتوسط الحسابيء ذي الحدين (sqri(p(1-py/n))‏ 
الخطأ المعياري للمتوسط الحسابي» بواسون (sqrt(mean))‏ 
المجاميع 

المجاميع مع تجاهل قيم استثنائية يتم تحديدها 

عدد المشاهدات الموجودة فعلا باستثناء القيم المفقودة 

أعلى قيمة 

أقل قيمة 

المدى الربيعي 

أول القيم 

آخر القيم 

قيمة أول مشاهدة موجودة (يتم استثناء القيم المفقودة). 

قيمة آخر مشاهدة موجودة (يتم استثناء القيم المفقودة). 


هناك عدد كبير من الحسابات الإحصائية يمكن إجراؤها باستخدام أمر 
أكثر مرونة وهو الأمر statsby‏ وتتم كتابته قبل كتابة الحسابات الإحصائية 


المطلوبة. 


فعلى سبيل المثال» وباستخدام بيانات global2.dta alal‏ نقوم بإنشاء 


متغير جديد يسمى decade‏ وهو يساوي 1880 للسنوات من 1889-1880» 
و1890 للسنوات 1899-1890 وهكذاء بعد ذلك نقوم بإنشاء ملف بيانات آخر 
يلخص الإحصائيات المهمة لدرجات الحرارة خلال عقد من الزمن. 


-use C:\data\global2.dta, clear 
-gen decade = 10*int(year/10) 
.Statsby, by (decade) clear:summarize temp 
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(running summarize on estimation sample) 


summarize temp 
r(N) 

r(sum w) 

r (mean) 

r(Var) 

r (sd) 

r (min) 

r (max) 

r (sum) 

decade 


command: 
N: 

Sum w: 
mean: 


Var: 
sd: 
min: 


max; 


sum: 
by: 


Statsby groups 


5 هله +— 3 —+}— 2 هد —+— 


البيانات الأخيرة تتضمن عدد المشاهدات» والمتوسط الحسابي» والتباين» 
وأعلى dad‏ وملخص بإحصائيات أخرى لكل عقد من العقود الزمنية في 
البيانات؛ الشكل )3.2( يعرض رسما Lily‏ بأعلى انحراف لدرجة الحرارة 
الشهرية لكل عقد (باستثناء عقد 2010 لأنه يتضمن سنتين فقط). 


describe 
Contains data 
obs: 14 statsby: summarize 
vars: 9 
size: 504 
storage display value 
variable name type format label variable label 
ss SSS 
decade float %9.0g 
N float %9.0g r(N) 
sum w float %9.0g r(sum w) 
mean float 9.09 r (mean) 
Var float %9.0g r (Var) 
sd float %9.0g r(sd) 
min float %9.0g x (min) 
max float %9.0g r (max) 
sum float %9.0g r (sum) 
———————————————————————————l 
Sorted by: 
Note: dataset has changed since last saved 


-graph bar max if year«2010, over(decade) 
ytitle("Maximum global temperature anomaly, C") 
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الشكل )3.2( 


الأمر statsby‏ يمكنه Las‏ إنشاء بيانات من نتائج معادلات الارتباط أو 
أي تحليلات أخرىء» لمزيد من التفاصيل والأمثلة عن هذا الأمر» قم بطباعة 
chelp statsby‏ كما أن دليل مرجع إدارة البياتنات Data Management‏ 
Reference Manual‏ يعرض معلومات عن هذا الأمر. 

مستخدماً قوائم ستاتا قم بالاختيار التالي: 

Statistics » Other < Collect statistics for a command across a by list 

سوف فتح نافذة لهذا الأمر» وهناك أمر مفيد Al‏ وهو contract‏ الذي 
يمكنه إنشاء بيانات بطريقه مشابهة للجدول التكراري لعدد من المتغيرات 
التي يتم تحديدها (انظر (help contract‏ 
إعادة تشكيل Reshaping Data : Obli‏ 

هناك عدة طرق مختلفة يمكن القيام بها لإعادة تشكيل البيانات باستخدام 
الأمر «reshape‏ هذا الأمر يُرتب البيانات بطرق بسيطة بين ترتيب طولي 
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وترتيب عرضي. ففي جزء سابق من هذا الفصلء قمنا بإنشاء ملف يحتوي 
wie‏ بيانات عن مؤشر ENSO‏ المتعدد Gus QMEIO. día)‏ إن البيانات في 
Gaui‏ عريض yg Gl gulli‏ لي ici gia‏ وکن US‏ بهن gi‏ موه 
منفصلء حيث إن العمود meil‏ يمثل قيمة المؤشر في شهر يناير» mei2‏ يمثل 
قيمة المؤشر في شهر فبراير وهكذا. 

-use C:\data\MEIO.dta, clear 








-describe 
Contains data from c:\data\MEIO.dta 
obs: 62 
vars: 13 29 Apr 2013 17:51 
size: 3,100 
storage display value 
variable name type format label variable label 
——————————————ÓÓ——— 
year int 58 . 09 
meil float %9.0g 
mei2 float %9.0g 
mei3 float %9.0g 
mei4 float %9.0g 
mei5 float %9.0g 
mei6 float 59.09 
mei7 float %9.0g 
mei8 float %9.0g 
mei9 float %9.0g 
meii0 float %9.0g 
meill float %9.0g 
meil2 float %9.0g 
Sorted by: 


-list year-mei7 in 1/5 


مر تج نا Ur‏ 
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يمكننا إعادة تشكيل هذا التنسيق العريض للبيانات وجعلها سلسلة زمنية 
في تنسيق طولي» فالأمر NER‏ يقوم بإنشاء متغير جديد باسم «nei‏ وكل صف 
€ البيانات الجديدة ذات التنسيق الطويل سوف يحتوي على محدد لكل 
مشاهدة i(year)‏ ومحدد لكل مشاهدة فرعية j(month)‏ . 


i(year) j(month) 


.reshape long mei, 





(note: j 1234567 8 9 10 11 12) 
Data wide => long 
Number of obs. 62 = 744 
Number of variables 13 => 3 
j variable (12 values) -> month 
xij variables: 

meil mei2 ... 2 -> mei 





.Compress 
.Sort year month 


-label variable mei "Multivariate ENSO Index’ 


-save C:\data\meil.dta, replace 
-describe 
Contains data from c:\data\meil.dta 

obs: 744 

vars: 3 30 Apr 2013 19:44 

size: 5,208 

storage display value 

variable name type format label variable label 
year int $8.0g 
month byte $9.0g 
mei float %9.0g Multivariate ENSO Index 
Sorted by: year month 





.list in 1/5 


مرا زح س Uo‏ 
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أصبح لدينا الآن سلسلة زمنية لمؤشر ENSO‏ المتعدد على شكل 
سنوي/ شهري مشابه للسلسلة الزمنية الخاصة بدرجات الحرارة العالمية التي 
تم حفظها في ملف global2.dta‏ سابقاً في هذا الفصل» مع وجود بيانات كلا 
الملفين مرتبة حسب السنة والشهرء يمكننا دمج الملفين في ملف واحد كما 


suse c:\data\global2.dta, clear 
merge 1:1 year month using C:\data\meil.dta 


Result # of obs. 
not matched 840 
from master 840 (_merge==1) 
from using 0 (_merge==2) 
matched 744  ( merge--3) 


بيانات درجات الحرارة في الملف global2.dta‏ تغطي كل شهر للفترة 
ما بين يناير 1880 وحتى ديسمبر 2011» Loin‏ البيانات بالملف meil.dta‏ 
تغطي فقط الفترة من يناير 1950 إلى ديسمبر 2011 وبالتالي لدينا 
840712x70‏ شهرًا موجودة فقط في الملف الرئيس» وهي لا تتطابق مع 
باقي البيانات» وهي عبارة عن 744-6212 Me‏ موجودة في كلا الملفين 
وهي متطابقة. 

بعد حفظ Gilly‏ الملف الجديد باسم eglobal3.dta‏ يمكننا أن نرسم شكلاً 
بيانياً للمدة الزمنية يوضح درجات الحرارة مع المتغير mei‏ خلال السنوات 
من 1950 وحقى 12011 هذان cis Chl La] cj tid‏ قالمتعير mei‏ 
سوف يكون على الجانب الأيمن لمحور sh sy‏ يشير إلى المحور العمودي 
2: الأمر graph‏ أدناه يقوم بإنشاء رسم بياني يتضمن منحنيين» منحنى 
لدرجة الحرارة والآخر للمتغير mei‏ وهي المدة. وتم رسم المنحنى الثاني 
Las‏ متقطعء كما أن الأمر يحدد Gad‏ مربع شرح الرسم البياني بصفين بدلا 
من الوضع الافتراضي وهو عمودان. النظرة الأولى للرسم البياني تشير إلى 
أن درجات الحرارة العالمية ومؤشر ENSO‏ في الغالب يتغيران معا من سنة 
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لأخرى؛ ولكن مؤشر ENSO‏ كان أكثر انخفاضاً من درجات الحرارة خلال 
العقود الأخيرة. الفصل )12( يتعامل مع مثل هذا النوع من نماذج السلاسل 
الزمنية بطريقة أكثر دقة. 





-sort year month 

-drop merge 

compress 

-save C:\data\global3.dta, replace 

«graph twoway line temp edate | | 

line mei edate, yaxis(2) lpattern(dash) || 
if year>1949, legend (row (2) ) 
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a Multivariate ENSO Index 


الشكل )4.2( 

الأمر :reshapre‏ يقوم بنفس العمل عند استخدامه بطريقة عكسية لتغيير 
البيانات من التنسيق الطولي إلى التنسيق العرضي»ء حيث LAS‏ تغيير 
السلسلة الزمنية للشهر والسنة الخاصة بدرجات الحرارة ومؤشر ENSO‏ 
لتكون في وضع عرضيء بحيث يكون كل صف يمثل Aiu‏ وکل عمود Sia;‏ 

gat‏ وذلك باستخدام الأوامر التالية: 
-drop edate‏ 
.reshape wide mei temp, i(year) j (month)‏ 
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استخدام الاوزان : Using Weights‏ 


يمكن لبرنامج ستاتا قبول أربعة أنواع من الأوزان: 

+ الأوزان التحليلية والتي تستخدم في ارتباط الربيعات الأقل وزناً والتحليلات 
المشابهة الأخرى. 

fweight‏ الأوزان التكرارية وتقوم بعد الأرقام المتكررة في المشاهدات» والأوزان 
التكرارية يجب أن تكون رقما صحيحا. 

iweight‏ الأوزان المهمة ويتم تعريفها حسب رغبة المستخدم. 

pweight‏ الأوزان الاحتمالية أو أوزان المعاينة وهي الجزء العكسي من احتمال أن 
مشاهدة ما تم إدراجها بسبب استراتيجية المعاينة. 


كل الأوزان ليست معروفة لكل أنواع التحليلات: فلا يمكننا مثلاً 
استخدام pweight‏ مع الأمر ‘tabulate‏ الاستخدام الفعال للأوزان يتطلب فيا 
كاملاً لما هو مطلوب من هذه الأوزان القيام به في أي تحليل. 
للثوزان تطبيقات إحصائية عديدة منها طرق تعويض الأشياء غير 
المتناسبة» وتصميمات المعاينة المعقدة» وهي ميزة عامة للدراسات 
الاستقصائية» والوزن pweight‏ يوفر طريقة لتعديل التحيّز في العينات 
باستخدام الأوزان الاحتمالية والتي تساوي 1/(احتمالية الاختيار)ء تحليل 
بيانات الدراسات الاستقصائية باستخدام الأوزان الاحتمالية يعتبر نقطة قوة 
لبرنامج ستاتاء والتي سيتم عرضها في الفصل 4. 
في بعض ALLY)‏ عملية الوزن تشبه إلى as‏ ما تجميع البيانات بطريقة 
تجعل المتغيرات تلخص إحصائيات العديد من المشاهدات الفرديةء فمثلاً 
بيانات الملف Nations2.dta‏ تحتوي على مؤشرات التطور البشري للأمم 
المتحدة» والتي توضح ظروف المعيشة في 194 دولة. 
.-use C:\data\nations2.dta, clear‏ 
-describe‏ 
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Contains data from c:\data\nations2.dta 


obs: 194 UN Human Development Indicators 
vars: 13 2 Jul 2012 06:11 
size: 12,804 
storage display value 

variable name type format label variable label 

ج 

country str21 5 Country 

region byte $8.0g region Region 

gdp float %9.0g Gross domestic product per cap 
2005$, 2006/2009 

school float %9.0g Mean years schooling (adults) 
2005/2010 

adfert float %8.0g Adolescent fertility: births/1000 
fem 15-19, 2010 

chldmort float %9.0g Prob dying before age 5/1000 live 
births 2005/2009 

life float %9.0g Life expectancy at birth 2005/2010 

pop float %9.0g Population 2005/2010 

urban float %9.0g Percent population urban 2005/2010 

femlab float %9.0g Female/male ratio in labor force 
2005/2009 

literacy float %9.0g Adult literacy rate 2005/2009 

co2 float %9.0g Tons of CO2 emitted per cap 
2005/2006 

gini float %9.0g Gini coef income inequality 
2005/2009 


Sorted by: region country 


"متوسط" “Mean”‏ العمر المتوقع هو 68.7 سنة: 
.Summarize life‏ 


Variable Obs Mean Std. Dev. Min Max 





life 194 68.7293 10.0554 45.85 82.76666 


المتوسط أعلاه يمثل متوسط العمر المتوقع للسكان في 194 دولة بالعينة 
وليس (EI‏ السكان 7 مليارات القاطنين في هذه الدول» حيث إن وزن متوسط 
العمر لأصغر دولة (توفانلو هي جزيرة صغيرة في المحيط الهادئ بعدد 
سكان يبلغ حوالي 0 نسمة) هو Andi‏ متوسط العمر المتوقع لأكبر دولة 
(الصين وعدد سكانها حوالي 1.3 مليار نسمة) ولكن باستخدام عدد السكان 
كوزن تكراري يمكننا الحصول على توقعات أكثر دقة عن متوسط العمر 
المتوقع لعدد السكان 7 مليارات ككل. 
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-summarize life [fweight=pop] 


Variable Obs Mean Std. Dev. Min Max 
life 6.669e+09 68.93644 8.095538 45.85 82.76666 
سوف نتم مناقشتها بتفصيل أكتر في‎ (pweight) الأوزان الاحتمالية‎ 
مفيدة مع إنشاء الرسومات البيائية.‎ (aweight) الفصل 4» والأوزان التحليلية‎ 
وسيتم شرحها في الفصل 3 أما المربعات الصغرى الموزونة فسوف يتم‎ 
شرحها في الفصلين 7 و8 مع بعض المواضيع الأخرى؛ أهمية الأوزان ليس‎ 
لها تعريف محدد» ولكن يمكن تطبيقها في برامج مكتوبة خصيصاً لأغراض‎ 
محددة.‎ 
: بيانات عشوائية وعينات عشوائية‎ cui 
Creating Random Data and Random Samples 


دالة الأرقام شبه العشوائية runiform()‏ تأتي في مقدمة الدوال التي 
تعطي لبرنامج ستاتا القدرة على إنشاء بيانات عشوائية أو عينات عشوائيةء 
دليل المستخدم Base Reference Manual‏ يعرض شرحا تقنيا لكيفية عمل 
دالة الأرقام شبه العشوائية» إذا كانت هناك بيانات في الذاكرة الحالية لبرنامج 
ستاتاء فإن yal‏ مثل الأمر أدناه يقوم بإنشاء متغير جديد باسم random‏ 
بطريقة عشوائية بقيمة 16 رقم يفصل بينها (0,1]. 
.generate randnum-runiform()‏ 
كما يمكننا إنشاء بيانات عشوائية من العدم» وللقيام بذلك سوف نقوم أولاً 
بمسح البيانات الموجو دة بالذاكرة الحالية لبرنامج ستاتا (إذا كانت هذه البيانات 
مهمة فيجب حفظها أرلا) ثم نقوم بتحديد عدد المشاهدات المرغوب بها في 
البيانات الجديدةء ثم تحديد تكرار الأر قام العشوائية مما يجعل عملية إنتاج 


أدناه يقوم بإنشاء بيانات تحتوي على 10 مشاهدات ومتغير واحد يسمى 
randn um‏ 
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api‏ ا ا س | 


-clear 


“set obs 10 

.Set seed 12345 

generate randum = runiform() 
list 


.309106 
.6852276 
- 1277815 
-5617244 
-3134516 


برا رم س Uo‏ 


. 5047374 
-7232868 
-4176817 
.6768828 
-3657581 


O w تك مه‎ 





بالجمع بين دوال الجبر والإحصاء الخاصة ببرنامج ستاتا runiform()‏ 
يمكن إجراء قيم لعينة تم جمعها من توزيعات نظرية متنوعة»ء فإذا كنا نريد 
متغيرًا جديا لنفرض أن اسمه newvar‏ لعينة تم جمعها من توزيع منتظم 
حتى (0,428] Ya‏ من المعتاد وهو (0,1] فإننا نقوم بطباعة الأمر. 
generate newvar = 428 * runiform()‏ 
الأمر سوف يل ينتج قيماً حتى 16 Shy dy‏ قة ترية أعداذا 
صحيحة فقط من 1 إلى 428« الدالة ceil)‏ توفر طريقة سهلة للقيام بذلك: 
generate newvar-ceil(428*runiform())‏ 
ولإنشاء عينة عشوائية من 1000 مشاهدة وجدولها التكراري يتكون من 
6 خانات نقوم بطباعة الأوامر التالية: 
Clear‏ 
-set obs 1000‏ 


‘generate roll = ceil(6*runiform() ) 
:tabulate roll 
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roll Freq. Percent Cum. 





نظرياً نحن نتوقع أن نجد أن رقم 1 تكرر بنسبة %16.67 وأن رقم 2 
بنسبة %16.67 وهكذاء ولكن في أي عينة مثل تلك التي لدينا الآن والتي بها 
0 مشاهدة:؛ فإن نسبة كل مشاهدة سوف تتباين بشكل عشوائي حول القيم 
المتوقعة. 

ولإنشاء dine‏ مجموعة تتكون من 1000 مشاهدة وجدول تكراري 
يتكون من زوجين من رقم 6 يكون الأمر. 

generate dice = ceil(6*runiform()) + 


ceil(6*runiform(() 
.tabulate dice 


dice Freq. Percent Cum. 





يمكننا Laf‏ استخدام on‏ لتكوين عينة صناعية» الأوامر التالية تقوم 


بإنشاء بيانات تتضمن 5000 مشاهدة ومتغير واحد باسم index‏ يحتوي على 
قيم من 1 إلى 5000. 
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الفصل H‏ إدارة OO‏ س 


.set obs 5000 





-generate index = n 
-summarize 
Variable Obs Mean Std. Dev. Min 
roll 1000 3.521 1.73279 1 6 
dice 1000 6.953 2.429546 2 12 
index 5000 2500.5 1443.52 1 5000 


لإنشاء متغيرات عشوائية من توزيع طبيعي (توزيع (Cu gle‏ نستخدم Allo‏ 
anormal‏ الأمر التالي يقوم بإنشاء بيانات تتضمن 2000 مشاهدة 


ومتغيرين اثنين هما: المتغير z‏ من المجتمع N(0,1)‏ والمتغير u‏ من 
N(500,75)‏ 


-clear 

“set obs 2000 

‘generate z=rnormal () 

generate u=rnormal (500,75) 

المتوسط الفعلي للعينة والانحراف المعياري يختلف قليلاً عن القيم 
النظرية. 


summarize 


Obs Mean Std. Dev. Min Max 








Variable 





2000 -.0016761 1.013879 -3.645242 3.620961 
2000 498.4816 73.5583 248.0803 739.0969 


إذا كان المتغير 2 يتبع التوزيع الطبيعي» فإن v-e‏ تتبع 5l‏ —& 
اللوغاريتمي الطبيعي» ولإنشاء متغير لوغاريتمي طبيعي v‏ بناءً على توزيع 
طبيعي معياري نقوم بالتالي: 

‘generate v-exp(rnormal()) 
اللوغاريتمات يجعل قيم المتغير أكثر تناسقا.‎ edad 


لإنشاء قيم للمتغير w‏ والتي تم الحصول عليها عشوائيا من توزيع e‏ 
بمتوسط وانحراف معياري يساوي =p‏ 739 
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.generate w--3 * l1n(runiform()) 
بالنسبة للمتوسطات والانحرافات المعيارية الأخرىء سوف يتم‎ 
الاستعاضة عنها بتلاثة متغيرات أخرى.‎ 
5 يتبع توزيع كاي تربيع مع درجة حرية تساوي‎ x5 
.generate x5 - rchi2(5) 
بر يتبع توزيع ذا الحدين وتم إعطاؤه 10 محاولات مع نسبة احتمال‎ 
0.2 نجاح‎ 
.generate y - rbinomial(10,.2) 
45 يتبع توزيع ۲ مع درجة حرية تساوي‎ 145 
.generate t45 - rt(45) 
للحصول على قائمة كاملة بالدوال‎ help random قم بطباعة الأمر‎ 
الأخرى المتوافرة لإنشاء متغيرات عشوائية من توزيع بيتاء وتوزيع جاماء‎ 
والتوزيع فوق الهندسي» والتوزيع ذي الحدين» وتوزيع بواسون.‎ 
طريقة أخرى لإنشاء متغيرات طبيعية متعددة‎ js :drawnorm الأمر‎ 
وبه خيارات لتحديد الارتباط بين تلك المتغيرات» باستخدام الأمر‎ 
daly سوف يتم إنشاء بيانات تحتوي على 5000 مشاهدة لمتغير‎ 02 
كما يلي:‎ N(0,1) من‎ 


-clear 
.drawnorm z, n(5000) 
.Summarize 
Variable Obs Mean Std. Dev. Min Max 


z 5000 .0175441 .9919173 -4.112056 3.37486‏ 
«N(0,1)‏ المتغير x2‏ من «N(100,15)‏ المتغير x3‏ من «N(500,75)‏ بالإضافة 
cll‏ ذلك سوف نعطي لهذه المتغيرات ارتباطات المجتمع التالية: 
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عملية إنشاء مثل هذه البيانات تتطلب Y jf‏ تحديد مصفوفة الارتباط C‏ 
واستخدام C‏ مع الأمر -drawnorm‏ 

mat C = (1, .4, -.8 ١ .4, 1, 0 ١ -.8, 0, 1) 

-drawnorm x1 x2 x3, means (0,100,500) 

sds(1,15,75) corr(C) 

-Summarize x1-x3 





Variable Obs Mean Std. Dev. Min Max 
x1 5000 -.0268606 .9969571 -3.635491 3.657701 
x2 5000 99.77643 14.90536 42.78308 157.9469 
x3 5000 500.2264 76.41673 227.5245 731.9073 


correlate x1-x3 
(obs=5000) 





x1 1.0000 
x2 0.3787 1.0000 
x3 -0.8024 0.0181 1.0000 


قارن ox‏ ارتباط المتغيرات ومتوسطاتها بالعينة مع القيم النظرية 
المعطاة سابقا. البيانات العشوائية التي تم إنشاؤها بهذا النمط يمكن اعتبارها 
كعينة تم سحبها من مجتمعات نظرية ولا يجب أن نتوقع أن هذه العينات لها 
نفس سمات المجتمعات بالضبط (في هذا المثال سمات العينة كانت: متوسط 
المتغير 3× يساوي 500« وارتباط المتغيرين xI-x2‏ يساوي 0.4 وارتباط 
المتغيرين xJ-x3‏ يساوي 0.80- وهكذا)» العينات الصناعية المترابطة أو 
غير المترابطة يمكن إنشاؤها باستخدام قوائم ستاتاء ونوافذ الحوار التي يمكن 
الحصول عليها كما يلي: 
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Statistics < Other » Draw a sample from a normal distribution 
أو من خلال:‎ 


Statistics » Other » Create a dataset with specified correlation 
structure 


الأمر :sample‏ يقوم باستخدام بسيط لدالة runiform‏ لإنشاء عينات 
عشوائية لبيانات من ذاكرة ستاتا. فعلى سبيل المثال» لإلغاء كل بيانات العينة 
مع الإبقاء على نسبة %10 فقط من البيانات الأصلية قم بطباعة الأمر: 
¿sample 10‏ 
وعند إضافة المحدد هذ أو cif aadi‏ فإن الأمر as sample‏ بالإبقاء 
فقط على المشاهدات التي تنطبق عليها المعايير المطلوبة: 
sample 10 if age« 26‏ 
الأمر أعلاه سوف يُبقي على نسبة 9610 من المشاهدات كحد أدنى 
والتي فيها متغير age‏ أكبر من أو يساوي 26 وإذا كانت المشاهدات التي 
قيمتها أكبر من أو تساوي 26 فسوف يتم الإبقاء عليها حتى وإن جاوزت 
9610. 
يمكننا اختيار عينات عشوائية من حجم معينءلإلغاء كل المشاهدات التي 
تم اختيارها عشوائيا من بيانات في ذاكرة ستاتا نقوم بطباعة الأمر. 
-sample 90, count‏ 
الجزء الخاص بمحاكاة مونت كارلو في الفصل )14( يشرح بشكل 
تفصيلي أكثر عملية إنشاء متغيرات عشوائية. 


: برامخ لإدارة البيانات‎ d$ 
Writing Programs for Data Management 
إدارة البيانات في المشروعات الكبيرة تتضمن في العادة مهمات تكرارية‎ 
ويمكن لبرنامج ستاتا التعامل معها من خلال‎ clad أو قابلة لحدوث الأخطاء‎ 
كتابة برامج.خاصة»ء البرمجة المتقدمة يمكن أن تكون أكثر تعقيداًء ولكننا‎ 
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يمكن أن نبدأ بكتابة برامج بسيطة تحتوي فقط على تسلسل لأوامر ستاتا يتم 
كتابتها وحفظها في ملف نصيء والملفات النصية يمكن إنشاؤها باستخدام أي 
برنامج محرر نصي يُفضله المستخدم أو برنامج المفكرة والذي يوفر عدة 
أنواع من الملفات النصية التي تحتوي على خيارات مختلفة عند الحفظ File‏ 
c. Save As‏ إحدى الطرق السهلة لإنشاء ملفات نصية يتم باستخدام نافذة 
Do-file Editor‏ ببرنامج ستاتا والتي يمكن يمكن الوصول إليها عن طريق اختيار 
Window > Do-file Editor‏ أو بالضغط على أيقونة cet‏ أو من خلال 
طباعة الأمر doedit‏ أو doedit filename‏ إذا كان هناك أي ملف filename‏ 
نصي سبق تخز ينهء الأو yal‏ في نافذة المعاينة Review Window‏ يمكن 
تحديدها وإرسالها مباشرة إلى نافذة Do-File Editor‏ (انقر زر الفارة الأيمن 
للحصول على قائمة الاختيارات)» الأوامر يمكن نسخها ولصقها في نافذة 
Do-File Editor‏ من أي مصادر أخرى مثل ملفات التسجيل أو نافذة النتائج. 

في العديد من إجزاء هذا الفصل بدأنا ببناء بيانات درجات الحرارة 
العالمية بدءًا من درجة الحرارةء ثم إعادة تشكيل ودمج مؤشر ENSO‏ 
T ual y‏ شقن الموقر cla a,‏ اران في وسم iil‏ في SSH‏ (42). 
الأوامر التي قامت بتنفيذ كل هذه الخطوات يمكن تجميعها في ملف نصي 
asl y‏ كما سيتم شرحه الآن» يجب ملاحظة أن استخدام /// للإشارة بأن الأمر 
graph twoway‏ يستمر لأكثر من سطر واحد. في النهاية سوف يتم حفظ 
الرسم البياني في الشكل )4.2( بالامتداد (emf)‏ 


insheet using c:\data\glbal.csv, comma clear 
label data "Grlbal climate' 

label variable year "Year' 

label variable month "Month" 

label variable temp "NCDC global temp anomaly 
vs 1901-2000, ©" 

generate edate - mdy(month, 15, year) 

label variable edate "elapsed date' 

format edate %tdmcy 

sort year month 

order year month edate 

save c:\dataglobal2.dta, replace 
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use c:\data\MEIO.dta, clear 
reshape long mei, i(year) 3 (month) 
sort year month 
label variable mei "Multivariate ENSO Index" 
save c:\data\meil.dta, replace 
use c:\data\global2.dta, clear 
merge 1:1 year month using c:\data\meil.dta 
sort year month 
drop _merge 
compress 
save c:\data\globai3.dta, replace 
graph twoway line temp edate/// 
|| line mei edate, yaxis(2) lpattern (dash) lll 
|| if year>1949, legend(row(2)) 
graph save Graph "C:\graphs\fig02_04.gph", 
replace 
graph export "C:\graphs\fig02_04.emf", as(emf) 
replace 
هذا الملف سوف يتم إعداده بتحديد الأوامر في نافذة المعاينة ثم اضغط‎ 
ثم قم بحفظ ملف‎ Send to Do-file Editor الأيمن للفارة واختر‎ J uie 
من القائمة أو بكتابة الأمر:‎ cglobaldo جديد مثل‎ auly do-file 
:do global 


مثل بهذا sgg‏ البرابيج في ula‏ يكم do" aS oid,‏ رفاك 
برامج أكثر دقة (يتم إعدادها بواسطة ملفات do-files‏ أو تلقائيا بواسطة 
ملفات (ado-files‏ يمكن حفظها في ذاكرة ستاتا وتشغيل هذا الملف على 
برامج أخرى وإنشاء أوامر جديدة لبرنامج ستاتا وفتح ملف وورد للأخطاء 
المحتملة. 

برنامج ستاتا يقوم بتفسير نهاية سطر الأمر كنهاية للأمر تفسه» هذا 
معقول على الشاشة عندما يكون طول الأمر على عرض الشاشة ولكن قد 
يكون الأمر طويلا جدا بحيث لن يعمل عند طباعته في ملف نصيء لذلك فإن 
وجود ثلاث شرطات مائلة (I)‏ في نهاية سطر الأمر يشير إلى أن الأمر 
مازال مستمراً في السطر التاليء عام يق pA ET‏ في اة الوصول ا 
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i cf Qoa a 258. sc 
لا يعني الوصول إلى نهاية‎ (I) نهاية سطر الأمر مع ملاحظة أن وجود‎ 
الأمر.‎ 
do-files هناك طريقة أخرى للتعامل مع الأوامر الطويلة في ملفات‎ 
في‎ C) يحتوي على فاصلة منقوطة‎ Cus delimit; وذلك باستخدام الأمر‎ 
فبعد طباعة‎ Ah idl نهاية الأمر. في المثال أدناهء نقوم باستخدام الفاصلة‎ 
أمر طويل لا ينتهي حتى ظهور الفاصلة المنقوطةء وبعد ذلك نعدل المحددات‎ 
(cr) إلى قيمتها الاعتيادية باستخدام المحدد‎ 
#delimit ; 
Graph twoway line temp edate 
|| line mei edate, yaxis(2) lpattern (dash) 


|| if year>1949, legend(row(2)) ; 
#delimit cr 


ET EE O u i A 
NUPTIAS em من التوقف‎ Yas @ أيقونة‎ 
العمل حتى إظهار النتائج بالكامل وذلك بطباعة الأمر التالي:‎ 
eset more off 
JS هذا الأمر يعتبر مناسباً إذا كان البرنامج يعرض مخرجات بحجم‎ 
على الشاشةء ونحن لا نحتاج إلى رؤية هذه المخرجات أو نحن نقوم بكتابة‎ 
ess ملف تسجيل وسوف تتم مراجعة هذا الملف لاحقا. . وللرجوع إلى‎ 
السابق بحيث يجب علينا النقر على أي مفتاح لإظهار بقية النتائج نطبع‎ 
الأمر.‎ 


-set more on 


CAU eed 
الرسومات البيانية‎ 
Graphs 








تظهر الرسومات البيانية في كل فصل بهذا الكتاب» وهذا مؤشر على 
أهميتها udis‏ مع التحليلات الأخرى ببرنامج ستاتا. الرسومات البيانية 
التحليلية تعتبردائماً إحدى نقاط القوة ببرنامج ستاتاء والسبب أن هناك العديد 
ğa‏ الخيارات التي يتيحها برنامج ستاتاء ولا توجد في البرامج الإحصائية 
الأخرى. كما أن هذه الرسومات البيانية جذابة وقابلة للنشر وعملية إدراجها 
سهلة» وتتم من خلال استخدام الأوامر أو استخدام قوائم ستاتا باختيار 
«Graphics‏ وبالنسبة المستخدمين الذين يتصورون الحصول على رسومات 
بيانية دقيقة ورائعة سوف يجدون أق ها يتسورو lal poda‏ مع gps‏ العديد من 
الأدوات والخيارات المثيرة والمشروحة بتفصيل أكثر في دليل المستخدم 
Graphics Reference Manual‏ هناك العديد من الأمثلة في الدليل المرئي 
للرسومات البيانية ببرنامج ستاتا للمؤلف (Mitchell 2012)4 Visual Guide to‏ 
«Stata Graphics‏ 

في هذا الفصل»ء سوف يتم شرح عدة أنواع من الرسومات البيانية 
الرئيسة ببرنامج ستاتا وسيكون الشرح بأمثلة عملية بدلاً من الشرح النظري 

فقط (انظر دليل المستخدم Graphics Reference Manual‏ أو استخدم ملفات 
المساعدة help‏ للحصول على شرح نظري أكثر). عضن مسن ie‏ هذا 
الفصل سهلة ذا وتستخدم خيارات Aldi‏ وأحياناً لاتستخدم أي خيارات 
ولكن عادة الأمثلة البسيطة يتبعها أمثلة أكثر تعقيذاً مع بعض الخيارات 
التوضيحية وشرح عن كيفية إعداد الرسومات البيانية الجاهزة للنشرء 
وبالرغم من أن هذا الفصل يمكن المرور عليه سريعاً بقراءة كل مثال» ولكنه 


124 الإحصاء مع برنامج ستاتا 





يعتبر معرضاً للصور والأفكار التي يمكن استخدامها في إعداد الرسومات 
البيانية. 

المجموعة الكاملة للخيارات المتعلقة بالرسومات البيائية هائلة laa‏ ولا 
بسكن Gela of USI Tul‏ بالشرح ولكن UB‏ هذا الفصل توم Ac. saga‏ 
ALIS‏ من هذه الخيارات» وفي فصول لاحقة سوف يتم الشرح بصورة أكثر 
Slat‏ وتوفر قائمة ستاتا Graphics‏ الخيارات التي يمكن النقر Lede‏ 
للوصول إلى قوائم الرسومات البيانية مع نوافذ حوار توجد بكل نافذة منها 
أيقونة «Submit‏ هذه القائمة تعتبر طريقة مفيدة لتعرف ما هو متوافر من 
خيارات للتعامل مع العديد من الرسومات البيانية ذات الاتجاهين. 


أمثلة عن الأوامر : Example Commands‏ 


.histogram y, frequency 
يقوم هذا الأمر برسم مضلع تكراري للمتغير ر موضحا التكرارات على‎ 
المحور العمودي.‎ 
.histogram y, start(0) width(10) norm fraction 
بعرض 10 وحدات للمضلع‎ y يقوم برسم مضلع تكراري للمتغير‎ 
التكراري ويبدأ من نقطة 0( وإضافة منحنى التوزيع الطبيعي بناءً على‎ 
المتوسط والانحراف المعياري للعينة» كما أن الرسم يعرض كسور البيانات‎ 
على المحور العمودي.‎ 
.histogram y, by(x, total) percent 
لكل قيمة من‎ y في شكل واحد يتم رسم عدة مضلعات تكرارية للمتغير‎ 
أن المضلع التكراري الأخير يعطي المجموع للعينة ككل‎ LS or المتغير‎ 
ويعرض نسبا مئوية على المحور العمودي.‎ 


.kdensity x, generate(xpoints xdensity) 
width(20) biweight 


يقوم هذا الأمر بإنشاء منحني الكثافة اللبي kernel density‏ لتوزيع المتغير 
ox‏ وإنشاء متغيرين جديدين في البيانات هما المتغير xpoints‏ ويحتوي على 
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قيم المتغير × والتي تم تقديركثافتهاء والمتغير xdensity‏ مع كثافة تم تقديرها 
ذاتياء الخيار width(20)‏ يحدد نصف عرض مركز الكثافة بالوحدات للمتغير 
د وإذا لم يتم تحديد الخيار ( width(‏ فإن الوضع الافتراضي هو اتباع صيغة 
بسيطة للمستوى الأمثل» LÍ‏ الخيار biweight‏ ففي مثالنا هذا سوف يحدد 
مركز كثافة ثنائي الوزن بدلاً من الوضع الافتراضي وهو استخدام نواة 


-Epanechnikov 





-graph twoway scatter y x 
الخيار‎ cx يعرض رسم بياني للانحدار الخطي للمتغير ر على المتغير‎ 
فمثلا يمكننا طباعة الأمر‎ twoway هو جزء اختياري لجميع أوامر‎ graph 
-twoway scatter y x 
graph twoway lfit y x || scatter y x 
عل‎ y يقوم الأمر بإنشاء رسم بياني ثنائي لانحدار الخطي للمتغير‎ 
للمتغير‎ (fit 5 حيث يظهر في الرسم خط الانحدار (خط الانحدار‎ x المتغير‎ 
مقابل المتغير × كما يعرض الرسم أيضا انتشار قيم المتغيرين × ور والذي‎ y 
يوضح أن درجة الثقة 9695 في نطاق الانحدار الخطي.‎ 
.graph twoway scatter y x, xlabel(0(10)100) 
ylabel(-3(1)6,horizontal) 
ex مقابل المتغير‎ y يقوم بإنشاء رسم بياني نقطي لانشاء قيم المتغير‎ 
37. قيم‎ y إعطاء المحور الأفقي × قيم 0« £10 ... 100 والمحور العمودي‎ 
مع كتابة الأسماء في وضع أفقي بدلا من الوضع الافتراضي‎ 6 us 2= 
وهو الوضع العمودي.‎ 
.graph twoway scatter y x, mlabel(country) 
يتم‎ Cus × مقابل المتغير‎ y يقوم بإنشاء رسم بياني نقطي لإنشاء قيم المتغير‎ 
-country المتغير‎ Aa وهو‎ caul وكل نقطة لها‎ bla عرض البيانات على شكل‎ 
-graph twoway scatter y x1, by(x2) 
xl مقابل‎ y يقوم الأمر بإنشاء رسم بياني موحد لشكل انتشار المتغير‎ 
X2 ووضع مخطط منفصل لكل قيمة من قيم‎ 


126 الإحصاء مع برنامج ستاتا 


.graph twoway scatter y x1 [fweight = 
population], msymbol(oh) 


يقوم الأمر بإنشاء رسم بياني نقطي لانتشار قيم المتغير y‏ مقابل المتغير 
1× على USA‏ دوائر صغيرة (Oh)‏ وتكون مواقع هذه الدوائر تميل للوزن 
التكر ار ي للمتغیر population‏ 
.graph twoway connect y time‏ 
يقوم هذا الأمر بإنشاء رسم بياني lua‏ للمتغير ر مقابل المتغير time‏ 
حيث يتم تمثيل البيانات بنقاط يصل بين كل نقطة وأخرى bs‏ ولعرض 
الخط الواصل بين هذه النقاط بدون إظهار النقاط قمنا باستخدام الخيار line‏ 
Yas‏ من الخيار connect‏ كما يلي: 
.graph twoway line y time‏ 
الطريقة الأخرى لإنشاء رسم بياني مبسط للفترة الزمنية» تتم باس تخدام 
الأمر tsline‏ والذي يعمل مع الأمر tsset‏ وهذا الأخير يُستخدم لتحديد المتغير 
الذي يمثل الزمن (انظر الفصل 12). 2 " 
.tsline y‏ 
.graph twoway line y1 y2 time‏ 
يقوم الأمر برسم بياني للفترة الزمنية (في هذا المثال الرسم البياني 
سوف يكون من النوع الخطي) مع متغيرين هما yl‏ و2برولهما نفس 
المقياس» وسوف يتم تمثيلهما برسم بياني مع المتغير time‏ 


-graph twoway line y1 time, yaxis(1) || line 2 
time, yaxis(2) 


يقوم الأمر برسم بيانات المتغيرين 1ر و2ر ولهما قياسات مختلفة» حيث 

يتم وضع المنحنيين على نفس الرسم البياني» ويكون المحور العمودي في 

جهة اليسار She yaxis(1).‏ قياس المتغير 7ر بينما المحور العمودي في جهة 
اليمين yaxis(2)‏ يمثل قياس المتغير 2ر. 

.graph twoway contour temperature y x 

هذا الأمر يقوم بإنشاء رسم بياني ملون يعرض متغير temperature‏ على 

USA‏ شرائح مع المتغيرين × yy‏ حيث إن هذين المتغيرين يشبهان إحدائيات 
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cgil gall‏ وهناك مجموعة من الخيارات للتحكم في تفاصيل الشكل البياني» 
مثل عدد الألوان وطرق إضافة ألوان أخرى. 
.graph matrix x1 x2 x3 x4 y‏ 
يقوم هذا الأمر بإنشاء مصفوفة من الرسومات البيانية في شكل واحد 
يعرض كل أشكال الانتشار المحتملة الممكنة لكل المتغيرات الموجودة. 
.graph box y1 y2 3‏ 
يقوم هذا الأمر بإنشاء رسم بياني على شكل صندوق لكل متغير من 
المتغيرات y2, y3‏ ,1ر 
.graph box y, over(x) 3112© (23)‏ 
يقوم هذا الأمر بإنشاء رسم بياني على USA‏ صندوق للمتغير .رمع كل 
قيمة من قيم المتغير × ورسم خط أفقي عندما تكون Aad‏ 23 -بر 
.graph pie a bc‏ 
يقوم بإنشاء رسم بياني دائري مقسم إلى أجزاء» يشير كل جزء إلى 
القيمة المتعلقة بكل متغير من المتغيرات a, b, e‏ ويجب أن تقاس هذه 
المتغيرات بنفس وحدة القياس. 
.graph bar (sum) abc‏ 
يعرض هذا الأمر مجموع المتغيرات a, b, c‏ بأعمدة متراصة جنباً إلى 
جنب» وللحصول على المتوسط Yay‏ من المجموع نقوم بطباعة الأمر 
graph bar (mean) a b c‏ وهناك خيارات أكثر تتضمن الحصول على الوسيط 
ونسب مئوية وأعداد وإحصاءات أخرى لكل متغير (هذه الخيارات Qoa‏ 
(collapse‏ 
.graph bar (mean) a, over(x)‏ 
يقوم هذا الأمر بإنشاء رسم بياني يعرض متوسط المتغير a‏ مع كل قيمة 
من قيم المتغير x‏ 
.graph bar (asis) a b c, over(x) stack‏ 
يقوم هذا الأمر برسم أعمدة لكل es‏ المتغيرات a, b, c‏ حيث يتم وضع 
قيمة كل متغير فوق الأخرى في عمود واحد لكل قيمة من قيم المتغير x‏ 
.graph dot (median) y, over(x)‏ 
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يقوم هذا الأمر برسم شكل نقطي Cus‏ إن كل نقطة تمثل علامة مقياس أففي 
لقيمة الوسيط للمتغير ر عند كل قيمة من قيم المتغير » الأمر graph dot‏ يدعم 
نفس الخيارات الإحصائية التي يدعمها الأمر graph bar‏ والأمر collapse‏ 
.qnorm y‏ 
يقوم هذا الأمر بإنشاء رسم بياني يوضح التوزيع الطبيعي لقيم المتغير بر 
المتعلقة مع فئات التوزيع الطبيعي. 
.rchart x1 x2 x3 x4 x5, connect(1)‏ 
يقوم هذا الأمر بإنشاء رسم Al ja‏ الجودة R‏ موضحاً مدى القيم الممثلة 
بالمتغيرات من المتغير 1× إلى المتغير 5»» وللحصول على قائمة كاملة 
بالخيارات التي يوفرها برنامج ستاتا عن هذا الأمرء قم بطباعة chelp qe‏ 
والأمر أعلاه يمكن تطبيقه من خلال استخدام قوائم ستاتاء وذلك باختيار 
-Graphics < Quality control‏ 
خيارات الرسم البياني مثل التحكم في العناوين والتوصيفات وعلامات 
الاختيار على المحاور في الرسم من الخيارات الأكثر شيوعاً في جميع أنواع 
الرسومات البيانية ببرنامج ستاتاء كما أن التركيب المنطقي لأوامر ستاتا 
الخاصة بالرسوم البيانية ثابت من نوع لآخرء وهذه العناصر المشتركة تعتبر 
ميزة رئيسة تسهل عملية إنشاء أي رسم بياني. 


Histograms : GIK اطدرج‎ 


يعرض المدرج التكراري توزيع مقاييس المتغيرات» ويتم إنشاء هذا 

المخطط بالأمر chistogram‏ فمثلاً بالرجوع إلى بيانات مثالنا السابق عن 

4 دولة في الفصل )2( والذي يحتوي على بيانات مؤشرات التطور 
البشري والتي تم جمعها بواسطة الأمم المتحدة. 

.use C:\data\Nations2.dta, clear 

.describe 
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Contains data from c:\data\Nations2.dta 





obs: 194 UN Human Development Indicators 
vars: 13 2 Jul 2012 06:11 
size: 12,804 
storage display value 

variable name type format label variable label 

country str21 5 Country 

region byte $8.0g region Region 

gdp float %9.0g Gross domestic product per cap 
2005$, 2006/2009 

school float %9.0g Mean years schooling (adults) 
2005/2010 

adfert float %8.0g Adolescent fertility: births/1000 
fem 15-19, 2010 

chidmort float %9.0g Prob dying before age 5/1000 live 
births 2005/2009 

life float %9.0g Life expectancy at birth 2005/2010 

pop float %9.0g Population 2005/2010 

urban float %9.0g Percent population urban 2005/2010 

femlab float %9.0g Female/male ratio in labor force 
2005/2009 

literacy float %9.0g Adult literacy rate 2005/2009 

co2 float %9.0g Tons of CO2 emitted per cap 
2005/2006 

gini float %9.0g Gini coef income inequality 
2005/2009 





Sorted by: region country 
وهو يمثل‎ adfert. pial) الشكل )1.3( يعرض رسما لمدرج تكراري بسيط‎ 


معدل خصوبة المراهقين. وهذا الرسم البياني تم إنشاؤه بواسطة الأمر التالي: 
.histogram adfert, percent‏ 
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في قائمة ستاتا Edit > Preferences > Graph Preferences‏ لدينا 
Áo gana‏ من الخياراك لتصميمات معدة مسبقاً للألوان. dl‏ اضية والظلال 
والرسومات البيانية» LS‏ يمكن تحديد رسومات بيانية مخصصة لأغراض 
معينةء أغلب الأمثلة في هذا الكتاب سوف تستخدم لونين LS‏ مع هامش 
مظلل حول الرسم البياني. إن عملية اختيار اللونين الأبيض والأسود وألوان 
أخرى للرسومات البيانية يساعدنا في تحديد أفضل الأشكال لكل غرض من 
الأغراض المطلوبة» والرسم البياني يتم إنشاؤه وحفظه تحت تصنيفات معينة» 
بحيث يمكن استعادته وإعادة حفظه تحت تصنيف آخرء كما سوف يتم الشرح 
لاحقا. 

خيارات الرسم يمكن استخدامها بعد إضافة فاصلة إلى أمر إنشاء الرسم 
البياني» فالرسم البياني بالشكل )1.3( يوضح خياراً Val s‏ وهو النسبة المئوية 
Ya) percent‏ من density‏ وهو الخيار الافتراضي) حيث يتم عرض النسبة 
المئوية على المحور العمودي» وعند ظهور الرسم البياني على الشاشة توجد 
في نافذة الرسم مجموعة من قوائم الخيارات التي تتيح طباعة الرسم وحفظه 
ونسخه ولصقه في برامج أخرى مثل مايكروسوفت وورد. 

الشكل (1.3) يشير إلى التواء موجب للتوزيع مع منوال قريب من 
الصفرء وحد أعلى حوالي 200 من الصعب إعطاء شرح أكثر دقة لهذا 
الرسمء GY‏ الأعمدة لم يتم رسمها لتعبر عن قيم المحور الأفقي cx‏ الشكل 
(2.3) يعرض نفس الرسم البياني السابق بطريقة أخرى مع خيارات أخرى 
يمكن أن تجعل الرسم البياني أكثر وضوحا: 

frequency‏ التكرارات سوف تعرض على المحور العمودي بر 

start(0)‏ العمود الأول في المدرج التكراري سوف يبدأ من الصفر. 

width(10)‏ عرض كل عمود في الرسم البياني سوف يكون 10 وحدات. 

xlabel(0(20)200)‏ المحور الأفقي × سوف يبدأ من الصفر وحتى 200 بزيادة قدرها 
0 بين كل قيمة وأخرى. 
xtick(1020)210)‏ سوف تكون هناك نقاط في المحور الأفقي x‏ من 10 إلى 210 
بزيادة قدرها 20. 
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ylable(0(2)12,grid gmax)‏ المحور العمودي y‏ سوف يبدأ من 0 M‏ 5 بزيادة قدرها 


ا جوم جو اد tha z‏ عند 
title(“Adolescent fertility rate in 194 nations”)‏ وضع عنوان للرسم البياني في أعلى 
الرسم. 


الأمر أدناه والذي CoS‏ في أربعة أسطر لتسهيل عملية قراءته» ولجعل 
هذه الأسطر تعمل في ملف تنفيذي 00-516 يمكننا إضافة ثلاث شرطات Agli‏ 
M‏ في نهاية كل سطر من الثلاثة أسطر الأولى» والتي تشير إلى أن الأمر 
مازال FIM‏ السطر التالي: 
.histogram adfert, frequency start(0) width(10)‏ 
xlabel(0(20)200) xtick(10(20)210)‏ 
ylabel(0(5)35, grid gmax)‏ 
title ("adolescent fertility rate in 194‏ 
nations")‏ 


adolescer:t fertility rate in 194 nations 
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الشكل )2.3( يساعدنا في شرح التوزيع بشكل أكثر دقةء فمثلاً الآن 
يمكن أن نرى أن معدل خصوبة المراهقين في 34 دولة يتراوح بين 10 
;20( وللحصول على قائمة كاملة بخيارات وتركيبة الأمر histogram‏ قم 
بطباعة الأمر chelp histogram‏ وهناك أيضًا أمر آخر لرسم المدرج 
التكراري وهو الأمر Cus twoway histogram‏ يسمح لنا باستخدام خيارت 
iem pud‏ مع الأمر diss les Ca dwoway‏ ويمكن أن تتعلم 52S‏ 
حول هذه الخيارات بطباعة الأمر -help twoway histogram‏ 

asl‏ خيارات histogram jl‏ والتي يستخدمها مع elyi‏ أخرى من 
أوامرالرسم بياني هي قدرته على إنشاء عدة رسوم بيانية لكل قيمة لمتغير 
معين باستخدام الخيار cby(varmame)‏ الشكل )3.3( يعرض ia dues ls ois‏ 
للمتغير adfert‏ لكل إقليم من الأقاليم الخمسة التي تم دراستها مع euo‏ بياني 
سادس للمجموع (total)‏ يعرض التوزيع لكل الأقاليم. 


.histogram adfert, percent start(0) width(10) 
by(region, total) 
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Box Plots : زسم الصناوق‎ 


رسم الصندوق يعطي نظرة سريعة عن مدى تركز البيانات حول 
المركز وتشتتها وتناسقها وقيمها المتطرفة» فمثلا الشكل )4.3( يعرض رسم 
صندوق مبسط للمتغير adfert‏ (معدل خصوبة المراهقين)» حيث يمكن 
الحصول على هذا الرسم بطباعة الأمر التالي: 


.graph box adfer 
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الشكل (4.3) يؤكد الالتواء الإيجابي لهذا التوزيع» كما يعرض أعلى 
خيس قبع متطرقة: tally‏ الوس tg‏ من سوللي لزي الأرل اى 
الربع الثالث» وهذه المسافة تسمى المدى الربيعي interquartile range (IQR)‏ 
ويتضمن المدى %50 Ly‏ من البيانات» (رسم الصندوق في برنامج ستاتا 
يحدد الربيعات بنفس الطريقة في الأمر summarize‏ والأمن (detail‏ القيم 
المتطرفة تُعرّف بأنها ad‏ المشاهدات الأكبر من المدى الربيعي (5.1) وهي 
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تقع في النطاق الخارج عن المنطقة ما بين الربع الأول والربع الثالث» وقد تم 
توضيح القيم المتطرفة في الرسم باستخدام نقاط في أعلى الشكل البياني. 

الشكل )5.3( يحدد القيم المتطرفة بالمتغير adfert‏ ويصف نقاطها في 
الرسم مع قيم المتغير country‏ (أسماء الدول)» كما يحدد Lal gic‏ للمحور 
العمودي LÍ cy‏ الخيار marker‏ يمكنه أن يتحكم في الرموز والخصائص 
الأخرى التي تشير إلى القيم المتطرفة» فالخيار marker(1)‏ في هذا المثشال 
يشير إلى أول اسم في المتغير cy‏ وهناك متغير واحد فقط باسم «رولكن في 
بعض الحالات يمكننا أن نجد اثنين أو أكثرء ونحتاج إلى وضع علامات 
لقيمها المتطرفة بشكل يوضح كل متغير على حدة. 


.graph box adfert, marker(1, mlabel(country)) 
ytitle("Births per 1,000 females 15-19") 
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أحد أهم تطبيقات رسم الصندوق والأكثر شيوعا هو مقارنة توزيع متغير 
ما مع فئات متغير ثان؛ الشكل )6.3( يقارن بين توزيع المتغير adfert‏ 


الفصل الثالث : الرسومات البيانية 135 





لمجموعة من الأقاليم region‏ وبصفة عامةء فإن الوسيط تمت الإشارة إليه 
بخط أفقي بواسطة الخيار yline(39.3)‏ 


.graph box adfert, marker(1, mlabel(country)) 
yline(39.3) over(region) 
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رسوم الصندوق يمكن أن يكون اتجاههاً أفقياً بدلاً من الاتجاه العموديء 
وذلك باستخدام الأمر .graph hbox‏ الشكل )7.3( يستخدم معدل انبعاث ثاني 
أكسيد الكربون لكل فرد (c02)‏ وهو متغير آخر موجود في ملف البيانات 
2 هذا المثال يعرض مجم وعة من خيارات العناوين 
والتوصيفات التي يمكن تطبيقها على أي نوع من الرسومات البيانيةة» 
فالخيار ( note(‏ والخيار ( caption(‏ تضع النص تحت الرسم tl‏ في 
الشكل أدناه هناك عبارة “Statistics with Stata”‏ تظهر بخط أسود عريض 
وعبارة “Example of horizontal box plots”‏ بخط «Jie‏ وعنوان المحور 
العمودي» في الخيار ytitle‏ (عنوان المحور العمودي jg y‏ فيه كل رسم 
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صندوق أفقي يشير إلى محور أفقي)» أما نسبة CO;‏ فسوف يشار إليها 
gallia Mig‏ في الرس وکن الخطوظ قي اوم asd‏ يمكن اق بيه 
داخل الرسم نفسه باستخدام خاصية علامات ستاتا ولغة التحكم Stata markup‏ 


cand control language (SMCL)‏ لمزيد من ABI‏ عن ذلك قم بطباعة الأمر 
help graph text‏ 

.graph hbox co2, over(region) 

note("note: (bf:Statistics with Stata), 

version 12") 

caption("c aption: United Nations Human 

Development Report 

2011") 

title("title: {it:Example of horizont al box 

plots)") 

ytitle("ytitle: Tons of CO{subscript:2} 

emitted per capita') 


title: Example of horizontal box plots 


Africa 
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50 100 150 200 
ytitle: Tons of CO2 emitted per capita 

note: Statistics with Stata version 12 

caption: United Nations Human Development Report 2011 


0 


الشكل (7.3) 
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القيم المتطرفة الفردية لم يتم توصيفها في الشكل (7.3) لأنه من الصعب 
قراءة الوصف في التنسيق الأفقي. أما القيم المتطرفة الثلاث في أمريكا 
Americas‏ هي الولايات المتحدة وكندا وجزيرة الترينيداد وتوباجو (وهي 
جزيرة صغيرة في شمال أمريكا الشمالية تشتهربصناعة النفط والغار في 
الكاريبي)» ونرى أن أعلى معدل لإنبعاث ثاني أكسيد الكربون للفرد بدول 
القارة الأسترالية في أستراليا cOceania‏ وهناك أر بع دول مصدر s‏ للنفط فيها 
أعلى قيم متطرفة في آسيا tAsia‏ وبإلقاء نظرة أكثر تفحصاً للقيم المتطرفة» 
فإن رسم الصناديق يوضح أننا أحياناً نجد أن هناك بعض المش هدات المثيرة 
في البيانات نفسها وليس فقط في الحسابات الإحصائية. 

هناك عدد كبير من خيارات التحكم في المظهر والظلال وتفاصيل 
الصناديق في الرسم البياني» وللحصول على قائمة بهذه الخيارات قم بطباعة 
الأمر chelp graph box‏ وصف المحاور والنقاط والعناوين يمكن تعديلها 
بخيارات by(varname)‏ أو by(varname, total)‏ وهذه الخيارات تعمل ب نفس 





الطريقة مع أوامر رسم بياني أخرى ببرنامج ستاتاء فمثلا by(region)‏ سوف 
يقوم بإنشاء رسم صندوق في خمس توافذ صغيرة بدلا من خمسة صناديق 
في رسم بياني over(region)‏ واحد كما تم القيام به في الشكل (6.3) 
والشكل )7.3( 

Scatterplots and Overlays : dyo شكل الاننشار‎ 


شكل الانتشار هو جزء من عدد كبير من الرسومات البيانية التي Pe‏ 
«twoway‏ والأمر الأساسي لإنشاء شل الانتشار هو: 
-graph twoway scatter y x‏ 
us‏ إن المتغير «ريمثل المحور العمودي» والمتغير × يمتل المحور 
الأفقي (الجزء الرئيس للأمر graph twoway‏ اختياري ولكن تم كتابته هنا 
للتأكيد على أهميته التي سوف تتضح ح لاحقاً) Sas‏ باستخدام بيانات الملف 
Narions2.dta‏ يمكننا إنشاء رسم بياني للمتغير life‏ (متوسط العمر المتوقع) مع 
المتغير School‏ (متوسط سنوات الدراسة) وصورة هذا الرسم البياني تم 
عرضها في الشكل (8.3) حيث إن كل نقطة في الشكل تمتل دولة واحدة. 
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.graph twoway scatter life school 
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كما رأينا سابقاً في المضلع التكراري» فإنه يمكننا استخدام العديد من 
الخيارات مثل xlabel, xtitle, ylabel‏ للتحكم في توصيف المحور الأفقي 
والمحور العمودي والعناوين.. الخ» وكما رأينا في رسم الصندوق» فإن شكل 
الانتشار يسمح لنا بالتحكم في شكل الرسم ولونه وحجمه وتوصيفه وسمات 
abti‏ الشكل )8.3( يستخدم النقاط الافتراضية في الرسم وهي عبارة عن 
دوائر Adele‏ وهناك بعض التأثيرات التي يمكننا تضمينها في الرسم 
باستخدام الخيار US cmsymbo(0)‏ يمكننا استخدام gal c jas‏ مقل 
msymbol(Th)‏ (مثلثات مجوفة كبيرة)؛ msymbol(d)‏ (علامات ماسيّة 
صغيرة)» msymbol(?)‏ (علامات زائد)» msymbol(i)‏ (رموز مخفية» وهي 
طريقة عملية لبعض الأغراض الخاصة)ء وللحصول على قائمة كاملة 
GLOL Ib‏ والخيارات قم بطباعة help scatter Vl!‏ 
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الخيار meolor‏ يتحكم في لون النقاط في الزسم البياتي؛ فمثلاً الأمر: 
.graph twoway scatter waste metro, msymbol(S)‏ 
mcolor (purple)‏ 
سوف يقوم بإنشاء شكل الانتشارء بحيث إن كل نقطة بالرسم عبارة عن 
مربع أرجواني «pS‏ وللحصول على قائمة كاملة بالألوان المتوافرة قم 
بطباعة الأمر help colorstyle‏ وهذه الألوان قابلة للتطبيق على الأعمدة 
والخطوط والنصوص والعناصر الأخرى في أي رسم بياني ببرنامج ستاتا. 
أحد الخيارات المثيرة التي يمكن القيام بها مع شكل الانتشار هو جعل 
Gals ja jl pee‏ مع متغير cage e‏ يق إعطاء قاط ci ill‏ كلكلا 
مختلفاً. فعلى سبيل المثال» قد نقوم بإنشاء شكل انتشار للمتغير life‏ والمتغير 
school‏ ولكن pas‏ النقاط بالرسم البياني سوف يعكس عدد السكان في كل 
دولة pop)‏ وهذا ما تم عمله في الشكل )9.3( باستخدام الخيار 
[fweight=varname]‏ او باستخدام خاصية الوز زن ES‏ اري» كما أن jus‏ 

الدوائر المجوفة msymbol(Oh)‏ يعتبر Yes‏ تاا أكثر. 


.graph twoway scatter life school 
[fweight=pop], msymbol (Oh) 
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الأوزان التكرارية مفيدة مع بعض أنواع الرسم البياني الأخرى. وزن 
بعض العناصر يمكن أن يكون موضوعاً غامضاً ومعقذاء GY‏ الأوزان يمكن 
تمثيلها بأنواع مختلفة» ولها معاني مختلفة حسب السياق» وللحصول على 
معلومات عامة عن الأوزان يمكنك طباعة الأمر weight‏ ماعط. 


الخاصية الرئيسة لمجموعة أو امر graph twoway‏ هي قدرتها على وضع 
شكلين أو أكثر bea‏ لإنشاء أشكال أكثر cias‏ فمثلاً لإنشاء شكل انتشار 
للمتغير life‏ مع المتغير school‏ باستخدام دوائر مجوفة كعلامات بالرسم» 
يمكن ذلك بطباعة الأمر 
.graph twoway scatter life school, msymbol (Oh)‏ 
خطوط الانحدار البسيطة (fit)‏ هي نوع مختلف من رسومات «twoway‏ 
ولمشاهدة خط انحدار المتغير life‏ على المتغير school‏ مع تنسيق خط 
الالحدان ليكون ball‏ عريضاً Aaa fia Ap yay‏ لقوم بطباعة JÄN‏ 
.lfit life school, lwidth(medthick)‏ 
ولكن عادة نريد أن نرى شكل الانتشار» وخط الانحدار clea‏ يمكن القيام 
بذلك عن طريق وضع الرسم البياني afit‏ الخاص las‏ الانحدار فوق شكل 
الانتشار scatter‏ باستخدام أمر واحد مع || 'أنابيب") تشير إلى أنه تم و بشي 
الشكلين cles‏ الأمر أدناه تم كتابته في سطرين ولكن يُقترض أن نتم طبا 
في سطر واحد. 


.graph twoway scatter life school, msymbol(Oh) 
|| 1fit life school, lwidth(medthick) 


أخيرأًء إذا كان لدينا خيارات مؤكدة يمكن تطبيقها على الرسم البياني 
«JSS‏ فإن هذه الخيارات يمكن وضعها في نهاية الأمر بعد |4 الشكل )10.3( 
يوضح ذلك» فالخيارت العادة لا تتضمن فقط ylabel, xlabel, xtick‏ ولكن 
تحدد Laf‏ بعض التفاصيل حول مربع شرح الرسم البياني legend‏ 


.graph twoway scatter life school, msymbo1 (Oh) 
|| 1£it life school, lwidth(medthick) 

|| , y1abel(45(5)85) xlabel(2(2)12) 
xtick(1(2)13) 

legend(col(1) ring(0) position(11)) 
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الشكل )10.3( 


خيار legend.‏ في الشكل )10.3( يحدد ثلاثة عناصر هي: 


col(1)‏ مربع شرح الرسم يُفترض أن يكون في عمود واحد» وبالتالي سوف 


ring(0)‏ مربع شرح الرسم يجب أن يقع داخل منطقة الرسم بدلاً من خارجهاء 


لعناصر البيانات في مساحة صغيرة. 


position(11)‏ وهذا الأمر يضع مربع شرح الرسم في موقع الساعة 11 وهذا ما 
حدث في الرسم أعلاه حيث كان هذا الموضع Ja‏ من gh‏ بيانات. 


من أي 


بيانات» يُعتبر أفضل طريقة إذا كنا نستطيع التحكم في ذلك» ويمكنك اختبار 
ذلك من خلال وضع مربع شرح الرسم حسب الاختيار الافتراضي لبرنامج 
ستاتا أو تغيير موقعه إلى مكان آخر حسب ما تراه مناسباء ويمكنك الاطلاع 
على خيارات مربع شرح الرسم legend options‏ بطباعة الأمر help twoway‏ 
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options‏ وذلك cà xl‏ على الخيارات الممكنة للتحكم في موقع مربع شرح 
الرسم ومحتوياته وكيفية ظهوره. 
الشكل (11.3) يحاول التعامل مع هذه الأفكار بوضع ثلاثة أشكال مع 
بعضها. أحد هذه الأشكال الثلاثة من نوع .twoway‏ الخيار Ifitei‏ يعني رسم 
الانحدار الخطي مع فترة ثقة» وللقيام بذلك علينا أولا تحديد 15:8 شم يتم 
ARI‏ الرمادية» إذا قمنا بتحديد Mite‏ في آخر سطر الأمرء فإن فترات à Wb‏ 
سوف يتم رسمها فوق بعض النقاط في الرسم البياني النقطي. 
.graph twoway lfitci life school,‏ 
lwidth (medthick)‏ 
scatter life school, msymbol (Th)‏ || 
scatter life school if school»8 & life<55,‏ || 
msymbol(S) mlabel (country)‏ 
ylabel(45(5)85) xlabel(2(2)12)‏ ,|| 
xtick(1(2)13)‏ 
legend(col(1) ring(0) position(11) label (3‏ 
"Life expectancy")‏ 
order(3 2 1))‏ 


wo 
8 | ^ Life expectancy 5 
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الشكل )11.3( 
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الخيار الافتراضي :fitci‏ يعرض فترة الثقة للمتوسط الحسابي الشرطي 
conditional mean‏ للمتغير Yas y‏ من عرضه للقيم الفردية المتوقعة» وسوف 
يشير برنامج ستاتا إلى الخطأ المعياري للمتوسط الشرطي بعبارة "الانحراف 
المعياري للتنبؤ" أو م564. إذن فالخيار الافتراضي في الشكل )11.3( يعادل 
طباعة الأمر. 
.graph twoway lfitci life school, stdp‏ 
الأخطاء المعيارية للقيم الفردية المتوقعة يمكن وصفها بأنها "الانحراف 
المعياري للتنبؤ" أو cstdf‏ ولمشاهدة عرض أكبر لفترات الثقاة Glad gill‏ 
الفردية نقوم طباعة الأمر: 
.graph vwoway lfitci life school, stdf‏ 
الشكلان الآخران في الشكل )11.3( كلاهما رسومات بيانية لشكل 
الانتشار توضح كيف يتم وصف (أو إنشاء رسم بياني مع رموز مختلفة) 
مشاهدات معينةء وقد تم تحديد قيمتين متطرفتين عن طريق إنشاء شكل 
انتشار عادي مع كل البيانات» واختيار مثلثات مجوفة كعلامات لهذه النقاط. 
scatter life school, msymbol (Th)‏ || 
ثم نقوم بوضع الشكل مع شكل الانتشار الثاني (وهو الرسم البياني 
الثالث في الصورة أعلاه) مع استخدام المحدد if‏ لتحديد الدول التي فيها 
متوسط التعليم أكبر من 8 سنوات» ومتوسط العمر المتوقع أكبر من 55 dia‏ 
هناك دولتان فقط في أسفل اليمين تقابل هذه المعاييرء وتم الإشارة إليهما 
بمربعات غامقة وتم توصيفهما بأسماء الدول وهما بوتسوانا Botswana‏ 
وجنوب أفريقيا South Africa‏ فهاتان الدولتان اللتان يتمتعان بمستوى تعليم 
عالي ولكن مع متوسط عمر متوقع منخفض الأمر الذي جعلهما يبرزان عن 
بقية الدون الأخرى. 


|| scatter life school if school»8 &1ife<55, 
msymbol(S) mlabel(contry) 


الخيارات العامة في الشكل )11.3( تحدد توصيفات المحور الأفقي x‏ 
. وعلامات الرسم» كما تتحكم في مربع شرح الرسم» ومرة أخرى نعطي 
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نفسه» وتوصيف المتغير الثالث y‏ في مربع شرح الرسم هو 'متوسط العمر 
المتوقع" بدلا من التوصيف الأطول والذي يتم استخدامه كخيار افتراضي. 


legend(col(1) ring(0) position(11) label(3 
"Life expectance") 


الخيار legend.‏ : ينتهي بالخيار الفرعي )1 2 order‏ الذي يحدد بأن 
مربع شرح الرسم يجب أن يتم ترتيبه 1-2-3» وهذا لايبدو بسيطاً كما يظهر 
لأن طريقة ستاتا في فهم الأشكال البيانية الثلاثة المتراكبة في الشكل )11.3( 
تتضمن في الواقع أربعة متغيرات يمكن وضعها في مربع شرح الرسمء 
وبإعطاء عدد متسلسل للمتغيرات في الأمر graph twoway‏ هذا يعتبر 
)1( 7695 في فترة Adil‏ )2( القيم المناسبة أو توقعات الانحدار الخطيء 
(3) معدل العمر المتوقع في كل الدول للرسم البياني الأول وهو شكل 
الانتشارء )4( معدل العمر المتوقع لكل من بوتسوانا Botswana‏ وجنوب 
أفر South Africa Gi‏ في شكل الانتشار الثاني» بواسطة تحديد الخيار 
order(3 2 1)‏ فإننا نحدد QU‏ يكون هناك مربع لشرح الرسم البياني في الشكل 
)11.3( وهذا المربع يقوم بترتيب )3( أولاً )3 Gib‏ و(1) d ssl‏ تاركاً 
الشكل الرابع في الخارج حيث لم تتم الإشارة إليه في الخيار الفرعي 
IM corder()‏ فإن الخيار الفرعي order()‏ لايتحكمٍ فقط في ترتيب ظهور 
المتغيرات في مربع شرح الرسم ولكن يتحكم أيضاً في ظهورها. 

مصفوفات شكل الانتشار في الرسم البياني لشكل الانتشار ليست من 
نوع twoway‏ ولا يمكن تركيبها على رسومات أخرىء ولكنها تحتوي على 
رسومات بيانية متعداة يمكن أن تأخذ نفس الرموز النقطية في الرسم» الشكل 
)3 ا يعرض مصفوفة شكل الانتشار لرسومات بيائية تمثل شكل الانتشار 
لخمسة متغيرات في ملف البيانات Nations2.dta‏ 


.graph matrix gdp school adfert ide life, 
half msymbol (oh) 
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مصفوفة الانتشار في الرسم البياني لشكل الانتشار تمثل صورة مرئية 
لمصفوفة الارتباط والتي تعتبر مفيدة في حالة تحليل المتغيرات المتعددة؛ 
حيث إنها تعرض Ladle‏ للعلاقة بين axe‏ المتغيرات المتشابهةء مما يسمح 
بملاحظة وجود أي علاقات غير خطية أو قيم متطرفة أو الميول العنقودي 
الذي قد يؤثر على النماذج الإحصائية. العلاقات غير الخطية تتضمن متغير 
الناتج المحلي الإجمالي للفرد gap‏ والذي يظهر بوضوح في الشكل )12.3( 
معطياً تمثيرات حول هذا الميول حيث لا ia‏ وؤية هذا الميول في 
مقر فة aas s Jolt NI‏ 


الخيار half.‏ يحدد بأن الشكل )12.3( يجب أن 5( على الجزء 
الثلاثي السفلي للمصفوفة فقطء أما الجزء الثلاثي العلوي فسوف يتم إهماله 
لتماثله التام مع الجزء السفلي الخيار msymbol(o)‏ يُسمى الدوائر الصغيرة» 
ويُستخدم لوضع دوائر صغيرة كعلامات في شكل الانتشار» ويجب ملاحظة 
أن التحكم في المحاور في هذا النوع من SEY‏ يعتبر أكثر تعقيدا بسبب 
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وجود العديد من المتغيرات والمحاور. ولمزيد من التفاصيل عن التحكم في 
المحاور قم بطباعة الأمر -help graph matrix‏ 

عند احتواء المتغيرات على متغير مستقل واحد أو متغير مؤثرواحد من 
ناحية» وعدة متغيرات تابعة أو متغيرات متأثرة من ناحية أخرىء فإن هذا 
يساعد في عمل قائمة للمتغيرات اتابعة التي ظهرت عند اس تخدام الأمر 
«graph matrix‏ وهذا يؤدي إلى الحصول على رسم بياني متناسق للمتغيرات 
التابعة والمتغيرات المستقلة في الصف السفلي للمصفوفةء فالمتغير الأخير في 
الصف السفلي بالشكل )12.3( وهو متوسط العمر المتوقع life‏ يمكن تحليله 
كمتغير تابع في الفصلين (7 و8): 
الرسوهات البيانية الخطية والخطية اطنصلة : 

Line Plots and Connected-Line Plots 

الرسومات البيانية الخطية (graph twoway connect) Ala al‏ هي 
عبارة عن رسومات بيانية لشكل الانتشار تم وصل نقاطها بخطوط Lid‏ 
الرسومات البيانية الخطية (graph twoway line)‏ فتقوم بعرض خطوط بدون 
علامات مثلما رأينا في أشكال الانتشار. ولكن كلا النوعين ينتميان لنوع 
graph twoway‏ والتي يمكن تركيبهما ودمجهما في رسم بیاني واحد» خيارات 
أشكال الانتشار التي تتحكم في توصيف المحاور وعلاماتها تقوم بنفس 
الوظيفة في الرسومات الخطيةء والرسومات الخطية المتقصلةء وهناك 
خيارات أكثر للتحكم في عرض خط المحور ونمطه ولونه وعدة خصائص 
أخرى. 

الرسومات البيانية الخطية والخطية المتصلةء لها استخدامات أكثر من 
cdd‏ الأنتقان: ait dud stas Sd‏ ات فى بمتغير ما das‏ رة من 
امن واشوع هو gl lana‏ سرف نعو DN‏ مالف الوا ات 
Gilly Arctic9.dta‏ يحتوي على مشاهدات عن الجليدء Gla as‏ الحرارة في 
القطب الشمالي لفترة 33 سنة. 


euse C:\data\arctic9.dta, clear 
.describe 
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a‏ ب 


Contains data from c:\data\arctic9.dta 





obs: 33 Arctic September mean sea ice 1979-2011 
vars: 8 2 Jul 2012 06:11 
size: 891 
=m 
storage display value 
variable name type format label variable label 
year int tty Year 
month byte $8.0g Month 
extent float %9.0g Sea ice extent, million km^2 
area float $9.0g Sea ice area, million km^2 
olume float %8.0g Sea ice volume, 1000 km^3 
volumehi float %9.0g Volume * 1.35 (uncertainty) 
volumelo float %9.0g Volume - 1.35 (uncertainty) 
tempN float %9.0g Annual air temp anomaly 64N-90N C 


Sorted by: year 


الرسم البياني الخطي للمتغير area‏ مع المتغير year‏ يوضح الانخفاض 

في المنطقة الجليدية بالقطب الشمالي في شهر سبتمبر خلال الفترة» ولكن 

هناك انخفاضاً غير طبيعي في din‏ 2007 على وجه الخصوص si)‏ 
الشكل 13.3). 

graph twoway line area year, 

title("Arctic sea ice, September 1979-2011") 


Arctic sea ice, September 1979-2011 
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الشكل )14.3( يوضح الفترة الزمنية بطريقة أكثر دقة مضيفاً خطاً ثانياً 
لامتداد الجليد بالبحر extent‏ (المنطقة المغطاة بالجليد بنسبة %15 کل 
«(USVI‏ كما تم توصيف المحور الأفقي + بالسنوات من 1980 إلى 2010 
بفرق 5 سنوات بين كل سنة وأخر ی (xlable(1980(5)2010)‏ ولكن تم تقليص 
الرسم» Lal‏ المحور العمودي ر يبدأ من الصفر - وهو معدل محتمل وذو 
معنى لبعض المهتمين بالقطب الشمالي - إلى 8 بزيادة قدرها 1 مع خطوط 
شبكة في الرسم تتضمن أقل قيمة وهي 0 وأكبر قيمة وهي 8 وتم توصيف 
القيم بالأمر .ylabel(0(1)8, grid gmin gmax)‏ 
.graph twoway line area extent year,‏ 
xlabel(1980(5)2010)‏ 
xtitle(" ")‏ 
lwidth(medium medthick) lpattern(solid dash)‏ 
legend(row(2) ring(0) position(9)‏ 
label(1 "Area") label(2 "Extent") order (1 2))‏ 
ylabel(0(1)8, grid gmin gmax) ytitle("Million‏ 
km(superscript:2)")‏ 


title("Arctic sea ice, September 
1979'-char(150) '2011') 


Arctic sea ice, September 1979-2011 
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المتغير الأول في الشكل (14.3) وهو area.‏ تم رسمه بخط ذي عرض 
متوسط medium‏ ومتصل solid‏ المتغير الثاني وهو extent‏ تم رسمه بخط 
أعرض medthick Sul‏ ومتقطع «dash‏ خيار , legend()‏ يحدد التوصيفات 
بمربع شرح الرسم ويضع المتغير extent‏ أولا بمربع شرح الرسم ويضع 
المربع بموقع أعلى في الرسم. 

المنطقة الجليدية ومدى هذه المنطقة تم قياسه بمليون متر مربع» والخيار 
km {superscript:2}”)‏ 11102 يعرض joad Gl sie‏ العمودي 
«Million km?"‏ وللحصول على تفاصيل ASÍ‏ حول التحكم في النصوص 
بالرسم البياني» قم بطباعة o Cs «help graph text Y!‏ الشكل (7.3) 
يعرض أمثلة أخرى عن ذلك. 

طريقة أخرى لتغيير النصوص بالرسم البياني في الشكل (14.3) وهي 
مناسبة أكثر: السنوات 2011-1979 في العنوان يمكن فصلها بعلامة ( =( 
Yas‏ من علامة (- ( فالعلامة الأولى هي خاصية افتراضية لا تظهر في 
لوحة المفاتيح» ولکن يمكن تحديدها باستخدام رمز title Js «150 ASCII‏ 
في الشكل (14.3) تم إدراجه بواسطة ASCII‏ والرمز 150 بين سنة 1979 
و سنة 2011 بواسطة كتابة Lay 979'—char(150)2011‏ أنه تم اس تخدام 
علامات التنصيص في يمين السنة الأولى ويسار السنة الثانية. 





الشكل )15.3( يستخدم علامة ( - ) مع رمزين من رموز ASCII‏ في 
الجزء الخاص بالوقت في الرسم البياني» حيث إن المتغيرين اللذين بالرسم 
البياني تم قياسهما بمقاييس مختلفة» ولكن تم وضعهما في رسم بياني واحد. 
فعلى سبيل المثال» قمنا بوضع منحنى لمتغير المنطقة area‏ مع متغير السنة 
year‏ والمنحنى عبارة عن خط متصل (الخيار connect‏ يجمع بين خاصيتين 
هما (line scatter.‏ لدرجة حرارة القطب الشمالي مع السنة year‏ كما أن 
الرسم البياني يوضح أن الجليد في القطب الشمالي يتتاقص بسبب زيادة 
درجة حرارة الهواء في القطب الشمالي. المتغيران يؤثر كلاهما على الآخرء 
ويعكسان تغيرات أكبر ظهرت خارج منطقة القطب الشمالي. 
-graph twoway line area year, ylabel(0(1)6)‏ 


yline(0) 
ytitle("Ice area, million km'-char(178)'") 
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|| connect tempN year, yaxis(2) ylabel(-1(1)2, 
axis(2)) msymbol (+) 

ytitle("Arctic temperature anomaly, 
^schar(186)'C", axis(2)) 

|| , xiabel(1980(5)2010) xtitle("") 
legend(row(2) ring(0) position(6) 

label(1 "Ice area") label(2 "Temperature") 
order(1 2)) 

title("Arctic September sea ice and annual 
temperature, 

1979^-schar(150)'2011", size(medium)) 


Arctic September sea ice and annual temperature, 1979—2011 
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في JSAM‏ )15.3( درجة الحرازة للستوية في coll‏ الشمالي ثم Uglied‏ 
على المحور العمودي الثاني» والذي يظهر في يمين الرسم البياني» وقيم 
درجات الحرارة ثم تمثيلها بعلامات زائد (msymbol(+))‏ أما مربع شرح 
السادسة» موضحا المتغيرين في com ll‏ وبدلا من استخدام {superscript:2}‏ 
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73 أما الشكل )15.3( استخدم رموز45011 والرمز 178 وهو يشبه 
الرمز الذي تم إنشاؤه بالخيار (superscript:2)‏ ولكن يظهر بمظهر أفضل 
قليلاً, à‏ في المحور العمودي بالجانب الأيمن ASCI‏ والرمز 186 يعرض رمز 
درجة DU Med‏ 

كيف نعرف أن الرمز 150 dis‏ )7( وأن الرمز 186 dia‏ رمز 
درجة الحرارة وهكذاء الشكل )16.3( يعرض جدولاً لرموز ASCH‏ والشي 
c Cra!‏ بأداة سهلة casciiplot Laud‏ هذه الأدأة ليست جزءا من برنامج ستاتا 
ولكنها لغة برمجة برنامج ستاتا وتم كتابة البرنامج الذي أنتج الجدول بالشكل 
)3 .16( بواسطة عالم الإحصاء الجغرافي نيكو لاس كوكس «Nicholas Cox‏ 
Iguaall‏ على daga‏ عن AS‏ 159 وتتصيل Ais‏ عمل didi oh a‏ 
قم بطباعة الأمر cfindit asciiplot‏ ويمكن إنشاء الجدول بطباعة الأمر asciiplot‏ 
والذي يظهر في الشكل (16.3). 


ASCII Code Character Map 


use char(###) function to place symbols into graph text 





0. 1.2 d 4 & B 7 & B8 
3] ro" # $ * & ° 
4 [( ) * c , E ig / O 1 
2ه‎ 3456789: ; 
sh< = > ? QA BCODE 
JF GH | JKLMN O 
3P QR S8 TU V W X Y 
a2 [ XY d © . * a& kb c 
م‎ 10 0 e f g h i j kim 
Sun 0 Dp q fF s t uU v w 
ok y z {q 1 F 2 € 
Aula f . . t $ ^ * $ «x 
5 14| CE 2 M NL" 
Zij- — ° " 8 ص ر‎ à ow 
& 16| i € ع‎ "n ¥ | 8 ° © 
5175 « د‎ - ® °? + 2 8 
v1] op q - s v o? & » 8 
1% 4 A Á À A À A E © 
28 É Ê غ8‎ i | Í f ON 
2|0 نا ن © 6 6 0© ن‎ Û 
220 Y b 6 à á à à à à 
alec à8 6 ê 8 | i 1 i 
24 6 f 6 6 6 6 6 + @ ن‎ 
25] a ü ý y 
CO wg 2 5s 4.5 8 7 58 5 
Last Digit of Code 
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الشكل (15.3) يوضح أبسط طرق الربط connect‏ والتي يمكن 
استخدامها لربط نقاط البيانات بواسطة خط يربط بينهاء الطرق الأخرى 
للربط تم عرضها olii‏ الخطوط الافتراضية لربط النقاط هي 
cconnect(I) 3 connect(direct)‏ ولمزيد من المعلو مات قم بطباعة الأمر 
-help connectstyle‏ 
connect)‏ الاختصار T‏ 


Al تربط‎ N 1 none 

١ dect‏ (حرف إل) اربط النقاط بخطوط مستقيمة 
الست E‏ ربط النقاط بطريقة مباشرة فقط في حالة أن aliali‏ 
a A J stairstep‏ عمودي 


(none) stepstair‏ عمودي ثم أفقي 


Other Twoway Plot Types : JUI أنواع أخرى من الرسم البياني‎ 


بالإضافة إلى الأنواع الرئيسة للرسم البياني الخطي والنقطي يمكن للأمر 
bac aw) graph twoway‏ أنواع أخرى. وفي هذا الجزء سوف يتم شرح عدة 
أنواع من الرسومات البيانية الثنائية. وللحصول على قائمة كاملة بهذه الأنواع 
قم بطباعة الأمر .help graph twoway‏ 

في وقت سابق عند إنشاء الشكل (10.3) والشكل (11.3) قمنا باستخدام 
الأمر 156 graph twoway‏ وذلك لرسم خط الانحدار البسيط هناك أمر مشابه 
للأمر السابق وهو graph twoway qfit‏ الذي يقوم برسم منحنى الارتباط 
المتعدد من الدرجة الثانية أو التربيعي» الشكل )17.3( يوضح استخدام متغير 
آخر من ملف البيانات Arctic9.dta‏ وهو «volume‏ و هذا المتغير تم قياسه 
بالكيلو متر المكعب» حيث إن الرمز 9 من ASCI‏ يزودنا برمز المكعب 
في كلمة km?‏ ويجب الانتباه إلى أنه من الممكن استخدام .{superscript:3}‏ 


.graph twoway connect volume year, 
ylabel(0(2)16) yline(0) 
ytitle("Volume, thousand km'-char(179)'") 
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اتوت a A‏ 


|| afit volume year, lwidth(medthick) 
| | s Xlabel(1980(5)2010) xtitle("") 
title("Arctic sea ice, September 
1979^zchar(150)'2011") 


legend(row(2) ring(0) position(6) 
label(1 "Volume") label(2 "quadratic fit") 
order(1 2)) 


Arctic sea ice, September 1979-2011 
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الشكل (17.3) 

ميول المنحنى التربيعي نحو المحور الأفقي مقترباً من نقطة الصفر 
(yline(0)‏ يؤكد أن متوسط حجم الجليد في شهر سبتمبر انخفظ بشكل مستمر» 
الميول الخطي لن يعطي صورة واضحة عن الهبوط المتسارع وفي Vas‏ 
الأحيان فإن هذا الميول غير واقعيء المنحنى في الشكل )17.3( يعرض 
ارتفاعاً بسيطاً las‏ خلال السنوات الأولى وإذا توقعنا ما سوف يحدث في 
السنوات القادمة فإننا نتوقع أن حجم الجليد سوف ينخفض لأقل من الصفر؛ 
في الفصل (8) سوف نعود لهذه البيانات» ونأخذ في الاعتبار المنحنى بشكل 
كثر دقة. 
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الشكل (18.3) ينظر للمتغير volume‏ من زاوية مختلفة. ففي هذه المرة 
يستخدم الرسم البياني لمنطقة المدى graph twoway rarea‏ ليوضح بأن 9695 
من حدود عدم التأكد زائد أو ناقص 1.35 ألف كيلومتر مكعب (دراسة 
(Schweiger et al 2011‏ منطقة المدى أو الأمر rarea‏ يبحث عن متغيرين في 
المحور العمودي y‏ . وفي هذا المثال هذان المتغيران هما المتغير volumehi‏ 
و BoI ine W MERERSE OG SN‏ 
تطليلياء اريم لاقي gal ka‏ داوق a y‏ 41 خط (aye‏ 
(Iwidth(thiek))‏ وتم وضع هذا الشكل فوق الرسم البياني الذي يحدد منطقة 
المدى rarea‏ حتى يمكن مشاهدة المنطقة المظللة. 


graph twoway rarea volumehi volumelo year, 
color (gs13) 


|| line volume year, lwidth(thick) 
lcolor (green) 


||, ylabel(0(2)18) yline(0) 
ytitle("Volume, thousand km'-char(179)'") 


title("Arctic sea ice, September 
1979'=char(150) '2011") 


legend(row(2) ring(0) position(7) 


label(1 "uncertainty") label(2 "volume") order 
(2 1)) 


Arctic sea ice, September 1979-2011 
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الأمر graph‏ الذي تم استخدامه في رسم الشكل )18.3( يحدد ألوان خط 
الرسم البياني ولون منطقة المدى؛ Lil‏ الخيار color(gs13)‏ فهو يعطي منطقة 
المدى اللون الرمادي 13« وهو أقرب للون الأبيض Ade (gs16)‏ للون الأسود 
«(gs0)‏ الرسم البياني الخطي inn is‏ فوق هذا الرسم.ء والخط ذو لون 
أخضر؛ التحكم في الألوان Ya)‏ من استخدام اللون الافتراضي) يقوم 
بوظائف محدودة في حالة النشر باللونين الأبيض والأسود ولكنه SS‏ جداً 
في حالة استخدام عدة ألوان» ولمشاهدة قائمة بالألوان المتوافرة للرسومات 
البيانية في ستاتا قم بطباعة الأمر -help colorstyle‏ 

الشكل )19.3( يضع شكلين من النوع الثنائي لإنشاء صورة مختلفة من 
نفس المعلومات الخاصة بحجم الجليد في القطب الشمالي. في هذا الشكل 
البياني المتغير volume‏ تم تمثيله بأعمدة Liy graph twoway bar‏ مدى عدم 
التأكد ظهر كرؤوس مدببة Ya (rspike)‏ من نطاق ملون (rarea)‏ والذي سبق 
أن شاهدناه في الشكل )18.3( الأعمدة تم تلوينها بلون رمادي خفيف 
«(color(gs10))‏ ويجب ملاحظة أن الشكل (18.3) وضع خط المتغير volume‏ 
فوق منطقة مدى عدم التأكدء بينما وضع الشكل (19.3) الرؤوس المدببة التي 
تمثل مدى عدم التأكد في أعلى الأعمدة البيانية التي تمثل المتغير «volume‏ 
الترتيب في الشكلين مطلوب» حتى نستطيع مشاهدة الشكل بوضوح» ويمكنك 
اختبار ذلك مع أوامر مشابهة لمشاهدة كيفية عمل تلك الأوامر. 


.graph twoway bar volume year, color(gs10) 
|| rspike volumehi volumelo year, 
lwidth (medthick) 
|| , ytitle("Volume, thousand km*=char(179)'") 
title("Arctic sea ice, September 
1979` =char (150) '2011") 
legend(row(2) ring(0) position (7) 
label (1 "Volume") label(2 "uncertainty" ) ) 
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لا يجب الخلط بين الرسم البياني الثنائي المضلع graph twoway bar‏ 
والمضلع التكراري» حيث يوجد اختلاف بين الأمرين» فالأمر twoway bar‏ يقوم 
oL Rig‏ ويسم id ul‏ بردي الت رما أن المتغيرين تم 
قياسهما بوحدات قياس مختلفة» ولكنهما يشتركان في خاصيات متعددة مثل 
توصيف المحورين الأفقي والعمودي؛ واحتمالية وضع الرسومات فوق بعضها. 

ستاتا يوفر أكثر من 40 نوعاً tia‏ من أنواع الرسم البياني الثنائي 
graph twoway‏ لا يسع المجال لذكرها هنا. في الفصول القادمة» سوف 
iet gi cox‏ أخرى من هذه الرسومات» وللحصول على À LS À ad‏ 
بالأوامر الخاصة بهذه الرسومات وتركيباتهاء قم بطباعة الأمر help graph‏ 
twoway‏ 


Bar Charts and Pie Charts : الرسومات البيانية العمودية والدائرية‎ 


الأمر graph bar‏ يختلف عن الأمر «graph twoway bar‏ حيث إن الأول 
يعرض العلاقات التي تتضمن نوعاً Kaly‏ 3 أكثر من المتغيرات المصنفة 
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مثل هذه الأشكال البيانية تبرهن بشكل خاص على أهمية بيانات الدراسات 
الاستقصائية» كما سوف يتم عرضه في الفصل (4). هذا الجزء يعتبر 
كمقدمة لهذا الأمر مع أمثلة disi‏ متغيرات من ملف بيانات 
Nations 2.dta‏ 


.use C:\data\Nations2.dta, clear 
.describe region gdp pop 


storage display value 
variable name type format label variable label 
region byte — &8.0g region Region 
gdp float %9.0g Gross domestic product per cap 2005$, 2006/2009 
pop float %9.0g Population 2005/2010 


المتغير gdp‏ يمثل الناتج المحلي الإجمالي للفرد. وقيمه تتراوح Lisci‏ 
8 إلى 74.906 دولار ca jill‏ استخدام 5 أرقام كتوصيف للمحور 
الأفقي أو العمودي أمر غير عمليء لذلك سوف نبدأ بإنشاء متغير xus‏ باسم 
0 يوضح الناتج المحلي الإجمالي بآلاف الدولاراتء الشكل )20.3( 
يعرض المتوسط والمنوال للمتغير gdp1000‏ للقارات region‏ باستخدام الرسم 


-graph bar البياني العمودي‎ 
.generate 0021000 = gdp/1000 
-summarize gdp gdp1000 


Variable Obs Mean Std. Dev. Min Max 
gdp 179 12118.74 13942.34 279:8 74906 
gdp1000 179 12.11874 13.94234 .2798 74.906 


.graph bar (mean) gdp1000 (median) gdp1000, 
over(region) 


ytitle("Per capita GDP, thousands of 2005 US 
dollars") 


blabel(bar, format (%3.1£) ) 
bar(1, color(blue)) bar(2, color (orange) ) 


legend(ring (0) position(11) col (2) label (1 
"Mean" ) 


label (2 "Median") symxsize(*.5)) 





158 الإحصاء مع برنامج ستاتا 





[re] — " 
N J| WE Mean JW Median 23.5 


N 
EN 
to 






20 


1 
€ 


usc UN AD 





p 

S 

o 

o 

e 

5 

wo 

Q 

e 

N 

- 

O15 4 

0x 

0 pes | 

5 T: 

o vd 

£o 31 

a” Sra 

a wi 

o 58 

8 E | 

وان 13 

go الع‎ 

8 UE 

2 Ye 

a. A 
e$ J 

Africa Americas Asia Europe Oceania 
(20.3) الشكل‎ 


الشكل )20.3( يتضمن توصيفات تظهر في أعلى الأعمدة بالرسم 
البياني» ويعرض تنسيقات للأرقام cformat(%3.1f)‏ والذي يعني تنسيقات 
ثابتة مع ثلاثة أرقام» أحدها على يمين الفاصلة العشريةء والأعمدة يمكنها 
ليس فقط عرض المتوسطات أو المنوال وإنما Lal‏ عرض عدد من 
الحسابات الإحصائية الأخرى مثل النسب المئوية» وأعلى Aad‏ وأقل قيمة 
والأعداد. كما يمكتها أيضاً أن تعرض هذه الإحصائيات لأكثر من متغير 
واحد إذا تشابهت وحدة قياس هذه المتغيرات. 

مربع شرح الرسم في الشكل (20.3) يظهر في داخل الرسم نفسه في 
ناحية البيانات بموقع الساعة 11: ring(0) position(11)‏ وبه عمودان 
متوازيان cll Lis‏ جنب» Ll‏ الخيار symxsize(*.5)‏ يجعل حجم الرموز في 
المحور الأفقي في مربع شرح الرسم تظهر بنصف حجمها الافتراضيء وذلك 
لتوفير مساحة في الرسم. كما يجعل الرموز أكثر تشابهاً مع حجم الأعمدة 
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الرسم البياني العمودي graph bar‏ في المثال أعلاه؛ يحدد اللون الأزرق 
للعمود 1ء واللون البرتقالي للعمود 2. اللونان الأزرق والبرتقالي قد لا 
يظهران في هذه الصفحة بسبب الطباعة باللونين الأبيض والأسودء ولكن 
الاختلاف بينهما واضح» وكما أشار نيكولاس كوكس d Nicholas Cox‏ 
اللونين الأزرق والبرتقالي من الألوان التي تلفت الانتباه» لأنها dii‏ اختلافاً 
مرئياً واضحاً للقارئ عن أغلب الألوان «o AMI‏ فهي ملا تختدف عن 
الأحمر والأخضر. المحللون ربما يأخذون هذه الاختلافات في الاعتبار عند 
تصميم الرسومات البيانية Laie Lagai‏ تكون التفرقة بين الألوان od‏ في 
غاية الأهمية. 

الرسومات البيانية العمودية يمكنها توفير شرح واضح للعلاقات 
المتداخلة بين العديد من Casa 358 s aie y citi‏ أو أكثر. ومن ناحية 
أخرىء» فإن الرسم البياني الدائري نادراً ما يوضتح التحليل» ولكنه شائع في 
بعض المحاضرات العامة؛ الشكل (21.3) يشرح أمر إنشاء الرسم البياني 
الدائري graph pie‏ موضحاً عدد السكان لكل قارة» فالمتغير pop‏ يمتد من أقل 
من 10,000 إلى 1.32 مليار نسمة )1326 يعني ”10 x‏ 1.32 = 
0 2 ولإنشاء رسم بياني دائري سهل القراءة فإنه من 
الإفضل إنشاء متغير جديد باسم popmil‏ أو axe‏ السكان بالمليون نسمة. 


.gen popmil-pop/1000000 
. summarize pop popmil 





Variable Obs Mean Std. Dev. Min Max 
pop 194 3.44e«07 1.31e+08 9767 1.32e+09 
popmil 194 34.37752 131.4004 .009767 1324.696 


.graph pie popmil, over(region) pie(2, explode) 
plabel( all sum, format (%4.0f)) 

title("World population in millions, by 
region") 

legend(col(1) position(9)) 
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World population in millions, by region 





الشكل )21.3( 


الخيار pie(2,explode)‏ يقوم بإبراز الشريحة الثانية (Americans)‏ خار 35 
للتأكيد على أهميتهاء Lud‏ الخيار plabel( all sum, format(%4.0f)‏ يحدد 
توصيفات لكل الفئات بالشكل الدائري معطياً مجموع المتغير popmil‏ 
(مجموع عدد السكان بالمليون نسمة) لكل منطقةء Lal‏ توصيفات الرسم البياني 
yp Jal‏ تم تنسيقها بالأمر format(?64.0f)‏ و الذي يعني Lad 5 Gun‏ ثابت مع 
أربعة أرقام بدون وجود أي أرقام بعد الفاصلة. 

لمشاهدة كل الخيارات المتوافرة مع الرسم البياني cg dll‏ قم بطباعة 
الأمر qe C) Cx help graph pie‏ ات تتضمن الطرق المختلفة لتتظيم 
البيانات» E‏ الخيارات المثيرة هو by(‏ والذي يقوم بإنشاء صورة تحتوي 
على رسومات بيانية متعددة يمكن مشاهدتها والمقارنة بينها. 


الرسم البياني للربيعات والرسم البياني SUN‏ : 
Symmetry and Quantile Plots 1‏ 
رسم الصندوق» والرسم البياني العموديء والمدرج التكراري» تلخص 
توزيع قياس المتغيرات» ولكنها لا توضح نقاطأ مهمة بالبيانات» فهي عبارة 
عن نظرة عامة على البيانات ككل. ومن ناحية أخرى» فإن الرسم البياني 
للربيعات» والرسم البياني التناظري» يتضمنان نقاطا لكل مشاهدة. فالقارئ 
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الفصل العاف i‏ متتس 


يحتاج إلى مجهود أكثر لقراءتهماء لأنهما يعرضان تفاصيل أكثر من تلك 
التفاصيل التي يعرضها الرسم البياني العمودي» والمدرج التكراري. 

المدرج التكراري لنسبة الإناث إلى الذكور في القوى العاملة ل 177 
دولة الموجودة في ملف البيانات —Nations2.dta‏ والتي تظهر في الشكل 
(22.3) تم تركيبها فوق منحنى التوزيع الطبيعي (توزيع جاوس) الذي يشير 
إلى أن المتغير femlab‏ (الذي يمثل نسبة الإناث في القوى العاملة) له ذيل 
أكثر من الطبيعي إلى aga‏ اليسار (الدول التي بها عدد إناث أقل في القوى 
العاملة) وذيل أقل من الطبيعي جهة اليمين وهذا يعني وجود التواء سالب. 


-histogram femlab, norm percent 


" 








y 6 8 
Female/male ratio in labor force 2005/2009 


الشكل )22.3( 


الشكل )23.3( يعرض هذا التوزيع في زس ooa‏ بع lisa pa ll‏ 
المسافة بين المشاهدة ith‏ التي تقع أعلى من الوسيط (العمودي) والمشاهدة ith‏ 
التي تقع تحت الوسيط. كل النقاط في الرسم كان سيتم وضعها على الخط 
المحوري لو كان التوزيع تناظريا. ولكننا نرى وجود مسافة تحت deja ll‏ 

وهذه المسافة تزداد بمقدار أكبر مشيرة إلى التواء سالب. 
.Symplot femlab :‏ 
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Female/male ratio in labor force 2005/2009 


Distance above median 





2 5 
Distance below median 


الشكل )23.3( 


الربيعات هي القيم التي تظهر في أسفل مستوى معين من البيانات. فمثلاً 
الربيع 60.3 هو عبارة عن القيم الأكبر من 9630 من البيانات (تشبه 
ال 7630(« وإذا Lied‏ بترتيب عدد المشاهدات p‏ تصاعدياء فإن قيمة المشاهدة 
Dias ith‏ الربيع «/(5-)» والرسم البياني للربيعات يقوم UT‏ بحساب جزء 
المشاهدات الذي تقع تحت كل قيمة في البيانات» ويعرض النتائج برسم بياني 
في Sal oca dg eL) SAY‏ الأربيعات sf‏ عوج کے انعسي ایی 
لديه البيانات الأصلية» ومن خلال التوصيفات الموج ودة بالرسم البياني» 
يمكننا تقدير بعض الحسابات الإحصائية مشل الوسيط (الربيع 0.5) أو 
العشيرات (الربيعات 0.1 0.2« 0.3 وهكذا) كما يمكننا أيضا قراءة الرسم 
البياني للربيعات لتقدير جزء المشاهدات التي تقع تحت قيمة محددة 

معطاة. 
.quantile femlab, xlabel(0(.1)1,grid)‏ 
ylabel(.2(.1)1,grid)‏ 
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الرسومات البيانية للربيعات العادية تسمى Lai‏ الرسومات البيانية 
للاحتمال الطبيعيء التي تقارن بين توزيع متغير ما مع ربيعات توزيع 
طبيعي نظري له نفس المتوسط والانحراف المعياريء هذه الرسومات تسمح 
Ul‏ بإجراء فحص نظري للانحراف عن التوزيع الطبيعي لكل جزء من 
التوزيع» والذي يمكن أن يساعد كدليل في اتخاذ القرارات التي تتعلق 
بالافتراضات الطبيعية والجهود التي تحاول جعل التحول طبيعياً أكثر. الرسم 
البياني للربيعات العادية بالشكل )25.3( للمتغير femlab‏ يؤكد Gb‏ الالتواء 
السالب والذي سبق ملاحظته سابقاء والخيار grid‏ يقوم بإنشاء خطوط 
شبكة ل 0.05« 40.10 0.25 (الربيع الأول) و0.50 (الوسيط) و0.75 
(الربيع الثالث) والربيعات 0.90 و0.95 للتوزيعات»ء قيم الربيعات 0.05 

و0.50 و0.95 تم عرضها في أعلى ويمين المحاور. 
.qnorm femlab, grid‏ 
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الشكل )25.3( 


Adding Text to Graphs : إضافة نص للرسومات البيانية‎ 


يمكن إضافة عناوين وشروحات وملاحظات للرسم البياني لجعله أكثر 
وضوحاًء ففي الشكل الافتراضي العناوين الرئيسة والعناوين الفرعية تظهر 
فوق منطقة البيانات (والتي ربما توثق مصدر البيانات «s‏ ومربع شرح 
الرسم يظهر تحت مندلقة الرسم» انظر الشكل 7.3) على سبيل المثالء والذي 
يستخدم عنواناً وشرحاً وملادظة. هذه الخيارات الافتر اضية يمكن تجاوزها. 
فمثلاً للحصول على ءعلومات أكثر عن خيارات العنارين» قم بطباعة الأمر 
shelp title options‏ وعن LS‏ أت تغيير المحتويات مثل حجم الخط ولونه قم 
بطباعة الأمر -help textbox options‏ 

كما أنه من الممكن Gh yo AL]‏ نصيّة في مواقع محددة داخل 
منطقة الرسم نؤسه. led‏ سبيل المثال؛ ربما زريد إضافة ملاحظة في 
رسم بياني لسلء.لة زمنية مثل تواريخ ذوبان الجليد في بحيرة وينبيسوكي 
Lake Winaipesaukee‏ كما ثم الإشارة إليها في الشكل (26.3). 
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الفصل eee‏ $$$ 


euse C:\data\lakesunwin.dta, clear 


H 
.describe 
Contains data from c:\data\lakesunwin.dta 
obs: 144 Sunapee & Winnipesaukee ice out 1869-2012 
vars: 5 4 Jul 2012 11:21 
size: 1,728 
storage display value 
variable name type format label variable label 
year int Sty Year 
sunedate float %tdcymd Date Lake Sunapee Ice-Out 
sunout int %9.0g Lake Sunapee Ice-Out day 
winedate int $tdCYmd Lake Winnipesaukee Ice-Out 
winout int %9.0g Lake Winnipesaukee Ice-Out day 


Sorted by: year 


¿graph twoway line winoutyear 

|| lowess winout year, lwidth (medthick) 

|| if year>=1887 , xlabel(1890(10)2010) 
legend(off) xtitle("") 

ytitle("Ice Out day of year") 

text(87 1905 "Early 20th century" "warming") 
text(130 1950 "Mid-century cooling" "(global 
dimming)", 

box margin(small) bcolor(gs11)) 

text (125 1998 "Mode::n rapid" "warming", 
justification(left)) 
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الشكل )26.3( 
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الرسم البياني المبسط في الشكل )26.3( من نوع eu Qhartwoway line‏ 
ذوبان الجليد في بحيرة Winnipesaukee‏ للفترة من Aia‏ 1887 إلى 2012 تم 
وضع شكل بياني ثان يعرض منحنى أنحدار dowes‏ تم رسمه بخط Lua‏ 
العرض (width(medthick))‏ ليكون أكثر وضو Jai 5 dis‏ القطع التمهيدي - 
سوف يتم شرحه في الفصل )8( of‏ فخلا مركا AL al‏ اتجاقن 
البيانات؛ وله عدة مزايا تجعله أفضل من طرق المتوسط المرجح» Ud‏ منحنى 
القطع التمهيدي في الشكل )26.3( يوضح اتجاهات عدة عقود التي تكمن 
وراء التغيرات التي حدثت من سنة لأخرى. 

الاتجاهات خلال عقود في وضع البحيرة تتبع بشكل عام نفس نمط 
درجات الحرارة العالمية» وبيانات ولاية نيوهامبشير خلال نفس الفترة التي 
تم شرحها في دراسة )20102 «(Hamilton et al.‏ أما تواريخ ذوبان الجليدء فقد 
شهدت انخفاضا عاما خلال فترة ارتفاع درجات الحرارة في نهاية القرن 19 
وبداية القرن 20( وكان هناك انخفاض بسيط في درجات الحرارة خلال 
الفترة من الأربعينيات إلى بداية السبعينيات» مما أدى إلى تغير في تواريخ 
ذوبان الجليد. وعالمياً فإن هذه الفترة تمشل المرحلة التي كانت تصل 
فيها أشعة الشمس إلى سطح الجليد بسبب التلوث الصناعي حسب دراسة 
«(Wild et al. 2007)‏ وخلال فترة زيادة درجة الحرارة والتي كانت ما بعد 
منتصف السبعينيات كانت تواريخ ذوبان الجليد في بحيرة Winnepesaukee‏ قد 
نقصت بدرجة كبيرة» حيث إن أحدث بيانات مسجلة لتواريخ ذوبان الجليد 
انت في سنة 2010 وسنة 2012. 

ADE‏ مربعات شرح نصية تم وضعها في منطقة البيانات بالشكل 
)26.3( توضح التغيرات المناخية. حيث يحتوي كل eos‏ على سطرين» تم 
الفصل بينهما بواسطة الخيار text()‏ مع علامتي اقتباس» فالخيارات text()‏ 
تحدد مربعات شرح الرسم البياني والتي عادة ما تحتاج إلى اختبار تحديد 
موقعها بالضبطء فمربع شرح الرسم الأول تم إنشاؤه بالأمر: 

text(87 1905 "Early 20th century" "warming") 
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حيث يقوم بوضع مربع الشرح في الموقع &^x-19055 y-87‏ استخدام 

الخيارات الافتراضيةء أما مربع الشرح الثاني فيتم وض عه عند y-130‏ 

Cus. 1x=19505‏ يُعرض مُحاطا بحدود يمكن مشاهدتها بوضوح مع هامش 

صغير small‏ حول النص» أما ألوان الحدود والخلفية فيتم تحديدها بلون 
gsll sale)‏ 

text(130 1950 "Mid-century colling" "(global 

dimming)", 

box margin(small) bcolor(gs11)) 

text(125 1998 "Modern rapid" "warming", 

justification(left)) 


وللحصول على مزيد من المعلومات حول التحكم في مربعات الشرح 


النصية يمكنك طباعة الأمر help textbox options‏ و الأمر help colorstyle‏ 


: Do-Files LAW| Glalo الرسم البياني مة‎ 
Graphing with Do-Files 


الأشكال البيانية المعقدة مثل الشكل )26.3( تتطلب أسطر 54.4 graph‏ 
طويلة (بالرغم من أن ستاتا يعرض الأمر بالكامل في سطر (asly‏ ملفات 
التنفيذ Do-Files‏ - التي تم شرحها في Jail‏ (2) - تساعد في كتابة الأوامر 
ذات الأسطر المتعددةء كما أنها تسهل حفظ الأمر» وإعادة استخدامه مستقبلاً 
في حالة الحاجة لتعديل الرسم البياني أو رسمه من جديد. 


الأوامر التالية تم طباعتها في محرر «Do-File‏ وحفظها في ملف aul‏ 
c figos 26.do‏ حيث إنها تمثل la‏ جديدا لرسم الشكل (26.3) من جديد. 


.use C:\data\lakesunwin.dta, clear 

.graph twoway line winout year /// 

|| 1owess winout year, lwidth(medthick) /// 

|| if year>=1887 , x1abel1(1890(10)2010) legend (off) 
xtitle("") /// 
ytitle("Ice Out day of year") /// 

text(87 1905 "Early 20th century" "warming") 
FET 

text(130 1950 "Mid-century cooling" "(global 
dimming)", /// 
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box margin(small) bcolor(gsi11)) /// 

text(125 1998 "Modern rapid" "warming", /// 
justification(left)) 

-graph save Graph C:\graphs\fig03_26. gph, 
replace 

-graph export C:\graphs\fig03_26.png, as (png) 
replace 

-graph export C:\graphs\fig03_26. eps, as(eps) 
replace 


"Me‏ /// في الملف | تنفيذي do-file‏ فإن ذلك 
يعني أن الأمر لم يكتمل بعد ومازال مستمرا في السطر التالي. والأمر يتم 
تنفيذه فقط عندما لا تحتوي نهاية السطر على UJ‏ أماالطريقة الأخرى لكتابة 
الأوامر ذات الأسطر المتعددة فتتم باستخدام الأمر #delimit;‏ والذي يقوم 
بتحديد نهاية الأمر باستخدام فاصلة منقوطة بدلاً من النهاية الافتراضية 
وهي ضغط مفتاح Enter‏ أو استخدام (#delimit cr)‏ التي سبق شرحها في 
الفصل (2). 

الأمر graph save Graph‏ يقو م بحفظ الصورة أو الرسم البياني (والتي 
يتم إعطاؤها Gal il band‏ مؤقتاً “Graph”‏ والتي تظهر في 36 $3 الرسم 
(Graph window‏ بتنسيق ستاتا الذي ينتهي بالامتداد gph‏ كما يمكننا تحديد اسم 
مؤقت لأي رسم بياني alls,‏ بإضافة خيارات أخرى للأمر graph‏ مثل خيار 
name(newgraph)‏ أو خيار 20 ig03_‏ سقس استخدام cea‏ هذه الأسماء 
المؤقتة للرسومات البيانية يُعتبر Lege Id‏ جداً عندما يكون لدينا مجموعة 
من الرسومات البيانية المعروضة:؛ ونريد حفظ أو طباعة أحدهاء كما أن 
إعطاء اسم مؤقت للرسم البياني الذي قمنا بإنشائه لا يعني حفظه في القرص» 
وليس من الضروري تطابق أسماء الملفات المؤقتة åh ginal y‏ وللحصول 
على معلومات أكثر عن خيارات الحفظ قم بطباعة الأمر -help name option‏ 

الأمر graph export‏ الموجود بالملف 00-516 يقوم بإنشاء إصدار ثان 
وثالث لنفس الرسم البياني بتنسيقات مختلفة. فالملفات ذات التنسيق Cpng)‏ 
تعتبر صورً! نقطية ولها دقة ثابتة وقابلة للاستخدام مع برامج أخرى؛ Sars‏ 
مشاركتها من خلال صفحات الويب ومايكروسوف بوربوينت وغيرها من 
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التطبيقات» Uf‏ الملفات ذات التنسيق (eps)‏ فهي ذات جودة عالية وتنسيقاتها 
مفضلة في النشرء ولمعرفة المزيد عن الخيارات «s ASI‏ يمكنك طباعة 
الأمر -help graph export‏ 
عند حفظ yal f‏ إنشاء وحفظ الرسومات البيانية في ملف تنفيذي باسم 
fig03 26do‏ يمكن تطبيق أوامر هذا الملف بطباعة الأمر التالي: 
.do fig03 26‏ 
الأمر أعلاه سوف يقوم بتنفيذ كل الأوامر التي يحتويها اله لف التنفيذي» 
حيث سيقوم بإنشاء الرسم البياني وحفظه في ثلاثة تنسيقات مذثلفة» وسوف 
E‏ الحفظ فوق الملفات الموجود مسبقاً. 
استعادة ودمخ الرسومات البيانية : 
Retrieving and Combining Graphs‏ 
أي رسم بياني مخزن ببرنامج ستاتا بتنسيق gph‏ يمكن استعادته في 
ذاكرة الجهاز باستخدام الأمر graph use‏ فعلى سبيل المثال» يمكننا استعادة 
الشكل (26.3) بطباعة الأمر: 
-graph use fig03 26.gph‏ 
عندما يظهر الرسم البياني في ذاكرة الحاسب» فإنه يُعرض على الشاشة 
ويمكن طباعته أو حفظه مرة أخرى باسم مختلف أو بامتداد مختلف» فمثلا إذا 
كان لدينا رسم بياني تم حفظه سابقا بامتداد امع يمكننا إعادة حفظه باستخدام 
امتدادات a‏ ختلفة مثل .ens, .png, emf‏ كما أنه من الممكن تغيير لون الرسم 
باستخدام قوائم ستاتا أو باس تخدام -graph use p‏ فمثلا c& lj]‏ 
26.gph‏ 7203 الذي تم حفظه سابقا كانت ألوانه بتنسيق 2526010 ولكن يمكننا 
أن نرى كيف يظهر الشكل البياني باستخدام تنسيق الالو s2monochrome o‏ 
(وهي بديل للخطوط المتقطعة بعدة ألوان) وذلك بطباعة الأمر: 
graph use fig03 45.gph, scheme (s2inono)‏ 
الرسومات البيائية المخزنة على القرص الصلب يمكن دمجها باس تخدام 
الأمر graph combine‏ بحيث يمكن عرض Bae‏ رسومات بيانية في نفس 
الإطار. 
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: 4 A 

ملف التنفيذ do-file‏ أدناه (تم حفظه À fig03_27.do pul)‏ أعيد تشغيله 

بطباعة الأمر 27 (do fig03‏ يدمج الشكل )17.3( والشكل (18.3) والشكل 

(19.3) والتي تم إنشاؤها في هذا الفصل» وجود // يشير إلى استمرارية 

الأمر في السطر التالي. والشكل النهائي الذي يظهر الرسومات المدمجة تم 
حفظه وإعطاوه اسم الشكل (27.3). 

.graph combine /// 

C:\A_books\SwS_12\graphs\fig03_17.gph /// 

C:\A_books\SwS_12\graphs\fig03_18.gph /// 

C:\A_books\SwS_12\graphs\fig03_19.gph ///, 

rows(2) altshrink /// 

title("Combining Figures 3.17-19", 

size(medium)) 

.graph save Graph C:\graphs\fig03_27.gph, 

replace 

.graph export C:\graphs\fig03_27.emf, as(emf) 

replace 


Combining Figures 3.17-19 


Arctic sea ice, Seplember 1979-2011 Arctic sea ice, September 1979-2011 
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الخيار rows)‏ يحدد أن الشكل )27.3( يجب أن يتم ترتيبه في شكل 
بياني فرعي في صفين اثتين»ء كما أنه من الممكن تحديد الخيار 
col(2).altshrink‏ والذي يحدد تتابع النصوص في كل شكل بياني صغير في 
الشكل البياني (27.3) ويجب ملاحظة أنه بالإمكان وضع عنوان عام (أو 
ملاحظة أو شرح أو عناوين للمحاور.. الخ) للشكل البياني JSS‏ ولكن لا 
يمكننا إجراء تغيير جوهري في محتويات الأشكال الفرعية الصغيرة بالرسم 
البياني. 


7 


Graph Editor : lA الرسم‎ jo 


محرر الرسم البياني Graph Editor‏ يتيح Ul‏ تعديل شكل الرسم البياني 
الموجود حالياً في الذاكرة Sl ge‏ كان هذا الشكل قد تم إنشاؤه الآن أو سبق 
حفظه من قبل وتم استعادته باستخدام الأمر «graph use‏ إنه من الأسهل أن 
تعرف معلومات حول خاصية تحرير الرسم بالتدريب عليها واختبارها الآن 
Yas‏ من الاطلاع عليها نظرياً فقطء فمثلاً إذا كنا نريد القيام ببعض التغييرات 
في الشكل )18.3( YJ fas‏ باستعادة هذا الشكل باستخدام الأمر: 
¿graph use C:\graphs\fig03_18.gph‏ 
في نافذة الرسم البياني Graph Window‏ اختر File > Start Graph‏ 
j Eidtor‏ اضغط على أيقونة تحرير الرسم البياني ب سوف يتغير مظهر 
نافذة الرسم حيث سيظهر شريط أدوات في الهامش الأيسر للنافذة ومتصفح 
لعناصر الرسم في الجانب الأيمن» كما يظهر في الشكل )28.3( شريط 
أدوات يحتوي على أداة المؤشر لاختيار أجزاء من الرسم البياني وأدوات 
أخرى لإضافة نصوص أو خطوطء LS‏ يمكن تحرير خطوط شبكة الرسم 
البياني» ويعرض متصفح عناصر الرسم قائمة لمحتويات الرسم البياني 
وتظهر علامة + بجانب بعض العناصر وبالنقر على علامة + سوف تتوسع 
القائمة لتعرض عناصر أخرى داخلهاء ويمكننا اختيار أي عنصر بالنقر عليه 
أو النقر على اسم العنصر في المتصفح في يمين النافذة (وهو الأسهل في 
الرسومات البيانية المعقدة). 
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File Edit Object Graph Tools Help 
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تنسيق "a‏ الرمادية التي تمثل مدى الخطأء والنقر على النطاق الرمادي 
(أو النقر على plot]‏ تحت القائمة plotregion!‏ بالمتصفح) لاختيارها سوف 
يتم تنشيط Plot]‏ في قائمة المتصفح» وفي الرسم البياني نفسه. إن عملية 
اختيار أي عنصر في الرسم سوف يفتح شريط أدوات علائقي GS‏ الرسم 
البياني مباشرة» وهذا الشريط يعطي معلومات عن خصائص العنصر الذي تم 
اختياره. 

وفي هذا المثال يمكننا رؤية أن plot!‏ منطقة المدى الملونة باللون 
الرمادي 13 Gray‏ وهو داكن بنسبة 7680 وذو عرض claus gin‏ إذا قمنا بالنقر 
على More...‏ في شريط الأدوات العلائقي» يمكننا الحصول على خيارات 
أكثر للتحكم في خصائص العنصر الذي تم اختياره. 


في الر سم البياني”51041“ يشير يشير إلى ناحية الرسم twoway rarea‏ وهو 
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Fie Edit Object Graph Tools Help 
يب بس‎ Blaha wo رد‎ 


Plottype: Rarea * Color: Gray 1: 
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تغيير نوع الرسم البياني plottype‏ من Rarea‏ (منطقة المدى) إلى Reap‏ 
(منطقة مخططة) واللون من 3 Gray‏ إلى 13 Gray‏ (داكن أكثر) وعرض خط 
الرسم من Medium‏ إلى Meo e‏ سوط عطي ارسي غلا lg‏ 
(الشكل 30.3). 










tf, Graph - fig03 18* 
fie Edt Object Graph Tools Help. 
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Plottype: Reap * Color: Gray 3 * Width: Medum thick = Patten: Sold More... 
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في الرسم البياني 02 يشير إلى خط الرسم البياني galls twoway line‏ 
تم تركيبه على المنحنى الرئيس في الشكل (18.3).؛ إذا قمنا باختيار plot2‏ 
في متصفح عناصر الرسم البياني Graph Editor‏ الموجود في الجانب الأيمن 
للنافذة» ثم قمنا بتغيير نوع الرسم plottype‏ من Line‏ إلى Scatter‏ واللون إلى 
Gray 5‏ سوف نحصل على الشكل )29.3(« الرسم البياني النهائي يتضمن 
apa‏ مع عبارة significantly lower”‏ 2010“ تم إضافتها بواسطة استخدام أداة 
T‏ (نص) وأداة السهم» وهما من ضمن الأدوات الموجودة في شريط الأدوات 
بالجانب الأيسر للنافذة. 


Arctic sea ice, September 1979-2011 
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الشكل )31.3( 


وعموماء فإن نافذة محرر الرسم البياني Graph Editor‏ لها خاصية تعديل 
الرسم البياني بعدة طرق يمكن التحكم بها باستخدام الأمر الأصلي «graph‏ 
ولكن لا يمكننا عمل بعض الأشياء الأخرى مثل نقل نقطة بيانات معينة في 
الرسم بالرغم من أنه يمكننا إضافة أو حذف علامات جديدة في أي موضع 
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بالرسم. ومن ناحية cs al‏ فإنه من السهل das‏ تغيير خصائص العلامات 
والخطوظ وتوصيف المحاور والعتاوين: LS‏ يمكتنا oae. pla} Lund‏ .في 
الرسم البياني وجعلها غير مرئية» ويجب ملاحظة أن أي تغييرات في نافذة 
محرر الرسم البياني Graph Editor‏ تصبح دائمة عند حفظها. 


Creative Graphing : lull الرسم‎ d إبداعات‎ 


الكاتب Edward Tufte‏ في كتبه المؤثرة والرائعة حول التمثيل البياني 
للبيانات )1990« 11997 2001« 2006( نصح بوضع مجم ردات أكبر عند 
تصميم أي رسومات بيانية لتمثيل أي نوع من البيانات. يعتق د الكاتب أن 
عرض تصميمات رائعة وواضحة؛ يعطي للقارئ مساحة للمقارنة» وفحص 
العلاقات بين مختلف المتغيرات» فمستخدمو برنامج ستاتا هم أناس عاديون» 
وستاتا يوفر مجموعة من الأدوات المرنة للتمثيل المرئي للبيانات المعقدة مما 
يسمح بتطوير الرسومات البيانية البسيطة أو إعادة تنظيمها بشكل جمالي أكثر 
لتظهر بأشكال جديدة. 
aaf‏ الموضوعات التي تناولها Edward Tufte‏ هو قيمة المضاعفات 
الصغيرة» وهي عبارة عن مجموعة من الرسومات البيانية االصغيرة التي 
تدمج في شكل واحد لتسهيل عملية المقارنة» graph jay‏ مع الخيار by‏ 
يمكنه إنشاء مثل هذه الأشكال بطريقة رائعةء الشكل )32.3( يوضح بيانياً 
عمق الثلوج في فصل الشتاء خلال فترة زمنية معينة لمنطقتين الأولى هي 
قرية في الجبال البيضاء بولاية نيو هامبشير بالولايات المتحدة والثانية مدينة 
بوسطون التي تبعد 225 كيلومترا lo.‏ (البيانات بالملف «(whitemt1. dta‏ 
عمق انثلوج تم قياسه على أساس يومي في المنطقتين» وهذه البيانات تغطي 
تسعة فصول شتاء متتابعة في الفترة من شتاء 1998-1997 إلى شتاء 
2006-2005 والمتغير dayseason‏ يقوم بعد الأيام من 1 uà‏ لكل فصل 
شتاء» والمتغي midepth c)‏ و bosdepth‏ يقيسان عمق TÈ‏ بالسنتيمتر في كل 
من Shall‏ البيضاء ومدينة بوسطون على «uM sill‏ المتغير season‏ يحدد 
فصول الشتاء للفترة من 1998-1997 إلى الفترة 2006-2005: باتباع 
الأمر twoway area‏ نقوم بإنشاء رسم بياني للمتغيرين mtdepth‏ و bosdepth‏ 


plas) 176‏ مع برنامج ستاتا 





مع | لمتغير dayseason‏ ونقو Mala e‏ الألوان لتكو نْ e‏ فاتحاً RAT‏ 
(gs11, gs5) USla‏ والتصميم يكون 3X3.‏ لكل فصل شتاء ونحدد e oo‏ 
والخيار symxsize(*.3)‏ يوفر مساحة في الرسم البياني وذلك بوضع الرموز 
في مربع شرح الرسم البياني ليكون عرضها %30 بدلا من العرض 
الافتراضي. 

.graph twoway area mtdepth bosdepth dayseason 
if dayseason>29 &dayseason«160, 

bcolor (gs11 gs5) ytitle("Snow depth, cm") 
by(season, rows(3) note("") 
legend(position(3))) 

x1abel1(30(30)150) ylabel (0 (20) 80) 
legend(cols(1) label(1 "White Mt") label (2 
"Boston" ) 

symxsize(*.3)) 
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الشكل (32.3) 
الشكل (32.3) يعرض الأجواء اليومية خلال تسعة فصول شتاء بولاية 


2 


نير إنجلاند» موضحا كيف أن عمق الثلوج يتغير في مكانين مختلفين وفترات 
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زمنية مختلفة» ففي الفتر ة من 2001-2000 إلى 2004-2003 يبدو أن 
هطول الثلوج كان كثيفاً في الجبال مع بعض العواصف القوية في مدينة 
Ul c olia gi‏ خلال الفترة 1999-1998 كانت الثلوج أعلى في الجبال مع 
وجود فترات بدون أي وجود للثلوج على الأرض. 

البيانات التي تم تمثيلها في الشكل (32.3) تم جمعها لدراسة كيفية تأثير 
الظروف الجوية بولاية نيوإنجلاند على مستوى الحضور في مناطق التزلج 
(در اسة Lary (7002, 2003 Hamilton et al.‏ أن مناخ الشتاء بولاية ني وإنجلاند 
أصبح أكثر دفئاً في العقود الأخيرة» فإن انخفاض مستوى لكرج sugli‏ 
السمة الغالبةء وارتفاع الحرارة يعتبر مشكلة بيئية لها أبعادها التي تو ثر على 
نواح أخرى مثل al jill‏ خلال فصل الشتاء» مناطق التزلج تتأثر ليس فقط 
بظروف تساقط الثلوج في المناطق المحلية وإنما تتأثر أيضاً بمستوى الثلوج 
في المدن البعيدة مثل مدينة بوسطون حيث يعيش العديد من المتزلجين. 
الشكل البياني التالي (33.3) يركز على فصل شتاء واحد لسنة 1999 - 
0 (ملف البيانات Cus «(whitemt2.dta‏ يبدأ بنفس عمق الثلوج في حواف 
الجبال والتي ظهرت في أعلى اليمين بالشكل (32.3). 

الشكل (33.3) يضع بيانات الجليد في حواف الجبال (منطقة الرسم 
البياني (twoway area‏ فوق رسم بياني خطي ieee line‏ عدد المتزلجين 
وعدد زيارات المتزلجين في كل يوم في منطقة تزلج واحدة في الجبال 
البيضاء بالقرب من مكان جمع بيانات عمق الثلوج» تم إنشاء رسم بياني 
يوضح ase‏ الزيارات (visits)‏ وعدد الزيارات المتوقع الذي تم حسابه بنموذج 
سلاسل زمنية (model)‏ النموذج تم شرحه بدراسة Hamilton et al.‏ )2007( 
يتوقع الحضور اليومي كدالة للعوامل الدورية الأسبوعية مع الجو وظروف 
الثلوج في الجبال ومدينة بوسطونء الأمر graph‏ يقوم بإنشاء الشكل )33.3( 
مخصصاً المحور y‏ بالجانب الأيسر لتمثيل بيانات عمق الثلوج بالسنتيمتر 
(depth, dosdepth)‏ والمحور بر في الجانب الأيمن لتمثيل عدد الزوارء 
والنموذج الخاص بالتنبق visits, model)‏ 
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الشكل )33.3( 

يجب ملاحظة أن الإعدادات الدقيقة للخيارات yscale(range()‏ و ylabel()‏ 
لكل من الرسمين البيانيين في الشكل (33.3) حيث استطعنا أن نطابق بين 
المقاييس» بحيث إن خطوط الشبكة الأفقية في الرسم تمثل مقاييس متغيرين 
اثنين في نفس الوقت وهذا ليس عمليا لكل أنواع البيانات» ولكن يمكنه تطوير 

يمين ويسار الرسم البياني. 
.graph twoway area mtdepth bosdepth 033356235‏ 
yaxis(1)‏ 
ytitle("Snow depth, cm", axis(1)) bcolor(gs12‏ 
gs6)‏ 
ylabel(0(10)60, axis(1))‏ 

line model visits dayseason, yaxis(2) 

lwidth(medthin medthick) 
ylabel(0(1)3, axis(2)) lcolor(gs1 gs0) 
|| if dayseason>29 &dayseason<160, 
r2("Daily skier/snowboarder visits") 
xlabel (30(30)150) 
xtitle("Days since November 1") 


legend(rows(4) position(2) order(4 3 1 2) 
label(1 "White Mt") 
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label(2 "Boston") 1abel(3 "model") label(4 
"attend") 

symxsize(*.3)) 

yscale(range(0,51) axis(1)) ylabel(0(10)50, 
axis(1) grid) 

yscale(range(0,5100) axis(2)) 
ylabel(0(1000)5000, axis(2)) 


أعلى قمتين في الرسم البياني في زيارات منطقة التزلج كانتا خلال فترة 
عطلة المدارس والتي تأتي بالتصادف مع هطول الثلوج في مدينة بوسطون. 
الدراسة الأصلية قامت باختبار وتأكيد التأثير المعنوي لهذه cal gall‏ وسوف 
يكون من الأسهل تمثيل البيانات بعدة أشكال بيانية ودمجها في شكل واحدء 
كما تم في الشكل )32.3( بدلاً من استخدام شكل واحد كما حدث في الشكل 
(33.3). 

أهرامات axe‏ السكان والتي تستخدم بشكل كبير بواسطة علماء الجغرافيا 
السكانية لتمثيل تركيبة السن والجنس للسكان» وهذه الأهرامات ليست ضمن 
أنواع الرسم البياني ببرنامج ستاتاء ولكن يمكن تركيبها بواسطة أعمدة بيانية 
أفقية من خلال استخدام الأمر «graph hbar‏ وهناك العديد من الطرق 
الأخرى للقيام cella;‏ الشكل )34.3( يوضح إحدى طرق إنشاء هذا النوع من 
الرسومات البيانية باستخدام هرم لمعدل المواليد بمقاطعة جرين لاند في 
الدينمارك والتي تقطنها أغلبية عرقية من الإسكيمو في سنة 2006 (المرجع: 
Hamilton and Rasmussen‏ 2010( عدد الإناث في كل فئة عمرية تم الإشار 
إليه بواسطة عمود إلى يمين مركز الرسمء وعدد الذكور الذي في نفس الفئة 
العمرية بواسطة عمود إلى اليسارء المجموعات ذات الفئة العمرية 90 سنة 
كانت كبيرة لتوصيفها بشكل منفردء لذا فقد تم تلوينها بلون بشريط رمادي 
لكل 20 سنة )19-0 سنةء 39-20 سنة وهكذا). على سبيل المثال» الرسم 
البياني يُشير إلى أنه في سنة 2006 معدل المواليد يتضمن 600 من الذكور 
أعمارهم 40 Ais‏ ولكن JÉ‏ من 500 من GLY!‏ أعمارهن 40 سنة لنفس 
الفترة» وهذا يعكس اختلاف الجنس في صافي الهجرة الخارجية:؛ البروز 
الرئيس في هذا الهرم يُظهر الارتفاع الكبير في معدل البالغين في ái‏ 
العمرية من 49-35 سنة (الذين ولدوا في الخمسينيات والستينيات) متبوعا 
بمجموعات من الشباب البالغين» كما يمكننا مشاهدة زيادة واضحة في عدد 
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المواليد الذين ولدوا في الثمانينيات والتسعينيات إلى البالغين من الزيادة 
الأولى في معدل call gall‏ الفئة العمرية من 14-10 سنة تشمل مجموعة 
كبيرة من الأطفال. 










Age 80+ 2006 


Age 60 to 9 





Age 40 to 59... 7 
هه‎ 


Age 20 to 39 


600 600 


400 200 0 200 400 
“Greenland-born males (left) and females (right)" 


الشكل )34.3( 


هفاك العديد من الطرق ul‏ يمكن elt Sy Galaad‏ الشكل )34.3( 
فصف البيانات (greenpop.dta)‏ يحتوي على aac‏ من males S3‏ والإناث 
females‏ في كل الأعمار cage‏ ولإنشاء رسم بياني يمثل الذكور على اليسارء 
نحن نحتاج إلى إنشاء متغير جديد يساوي عدد الذكور بإشارة سالبة. 

.gen negmales--males 
يمكن إنشاء هرم بسيط بدون أي توصيفات وذلك بطباعة الأمر:‎ 


-graph hbar (sum) negmales females if year==2006, 
over(age, descending gap(0) label(nolabel)) 


فإننا نحتاج إلى تحديد متغيرات وهمية هي femGRAY 9 maleGRAY‏ حتى 
Sus‏ الرسم البياني بموجب أو ناقص 700 كما يلي: 
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¿egen  maleGRAY = -(700-males) if (age>=20 
&age<40) 

| (age>=60 & age<80) 

.gen femGRAY = 700-females if (age>=20 &age<40) 
| (age>=60 &age«80) 

negmales, بوضع المتغير أت‎ ds يمكن رسمه الآن»‎ (34.3) osa 

females, maleGRAY, femGRAY‏ في أعمدة أفقية مع نصوص لتوصيف 

المناطق الرماديةء كما يمكننا تطبيق توصيفات مثل "600" على 600- على 

المحور العمودي بر حتى لا يظهر عدد الذكور سالبا في الرسم. 

¿graph hbar (sum) negmales females malGRAY 
femGRAY if 

year==2006, 

over(age, descending gap(0) label (nolabel) ) 

ylabel(-600 "600" -400 "400" -200 "200" 0 0 
400 600( 

ytick(-700(100)700, grid) legend(off) stack 

ytitle("Greenland-born males (left) and females 
(right)") 

bar(1, color(emidblue) ) bar (2, color (maroon) ) 
bar (3, 

color (gs14)) 

bar(4, color(gs14)) text (550 97 "2006", 
size(large) ) 

text(-550 11 "Age 0 to 19") 

text(-550 33 "Age 20 to 39") text(-550 53 "Age 
40 to 59") 

text(-550 76 "Age 60 to 79") text(-550 95 "Age 
80+") 


الشكل )35,3( يدمج خمسة رسومات بيانية iliua‏ مع نص ليعرض 
شكلاً بيانياً له بعض خصائص الجدول والشرح معا. الشكل الجديد يعرض 
التغير في عدد السكان للفترة من 2000-1990 لمختلف المجموعات العرقية 
لتي تعيش في المحافظات البعيدة بجنوب الولايات المتحدة (حسب بيانات 
التعداد السكاني للولايات المتحدة لسنة 2005) الجانب الأيسر للشكل (35.3) 
عبارة عن رسم بياني من نوع twoway‏ وللقيام بعرض تغيرات axe.‏ السكان 
تم تمثيل المتغيرات بيانيا لكل مجمو عة عرقية popwhh‏ ,مب[«اممم. .الخ وهي 
تمثل مجاميع تم حسابها لكل مجموعة عرقية كما يظهر في الشكل البياني 
أدناه (البيانات موجودة بالملف (southmig1.dta‏ معلومة إضافية مهمة لا تظهر 
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في منطقة الرسم البياني نفسه ولكن يمكن ملاحظتها من خطين تم توصيفهما 

لكل مجموعة عرقية في مربع شرح الرسم» فمثلا يستطيع القارئ أن يرى 

من خلال مربع شرح الرسم» أن axe‏ السكان الذين تمتد أصولهم من أمريكا 

اللاتينية Hispanic‏ قد زاد في الولايات الجنوبية بنسبة %61 خلال هذا العقد 
وضوحا مقارنة مع باقي المجموعات العرقية الأخرى. 

.graph twoway area popwbho popwbh popwb popw 

year, 

legend(rows(4) position(3) symxsize(3) 

label(1 "Other, +50%" "0.3 to 0.5m") 

label(2 "Hispanic, +619" "0.8 to 1.3m") 

label(3 "Black, +7%" "3.6 to 3.8m") 

label(4 "White, +6%" "14.9 to 15.7m")) 

xlabel(1990 2000) xtitle("") 

ylabel(0(5)20,angle(horizontal) grid) 


ytitle("Population in millions") 
title("Population growth 1990-2000") 


Population growth 1990-2000 % growth due to migration 


D White 12% 


» 


Black 096 





| | py Other, +50% 
0.3 to 0.5m 
| E Hispanic, +06 
| | 0.8 to 1.3m 
Black, +7% 
B 3.6 to 3.8m 
t3 White, +6% 
E= 14.9 to 15.7m 







n» Hispanic 34% 
[7 3 


Poulation in millions 


>. Other 26% 


1990 2000 


الشكل )35.3( 
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الجانب الأيمن للشكل )35.3( يتكون من أربعة أشكال دائرية vai‏ 
النسب المئوية للنمو السكاني نتيجة الهجرة؛ كل دائرة تم رسمها بشكل 
منفصل باستخدام البيانات الموجودة بالملف southmig2.dia‏ فمثلاً آخر شكل 
دائري يوضح أن %12 من العرق الأبيض كان نموه نتيجة الهجرة 
المتغيرات التي تظهر في الرسم البياني تمثل صافي الهجرة netmig w)‏ عبارة 
عن المجموع الكلي للهجرة الداخلية ناقص الهجرة الخارجية) ونمو عدد 
السكان نتيجة الزيادة الطبيعية nonmig w)‏ عدد المواليد ناقص are‏ الوفيات). 


.graph pie nonmig w netmig w, 

legend(off) pie(1, color(dkorange)) pie(2, 
color(gsi3)) 

title("White 12% ", position(2)) 


کل رسم بياني دائري يتم حفظه باسم» مثل pie white.gph‏ وبعد إنشاء 
وحفظ الأشكال الأربعة الدائرية يمكن دمجها معا باستخدام الأمر 
-graph combine‏ 


.graph combine pie other.gph pie hisp.gph 
pie black.gph pie white.gph, 

imargin(tiny) rows(4) 

title("% growth due to migration") fxsize(40) 


الخيار ifxsize(4)‏ يقوم بدمج الأشكال الدائرية الأربعة في شكل واحد 
ويستخدم %40 فقط من العرض c il shall‏ وبالتالي عند دمجه مع الجانب 
الأيسر للشكل (35.3) فإن الرسم البياني الدائري سوف يأخذ أقل من نصف 
العرض الكلي للشكل. 

هذه الأمثلة توضح بعض الإمكانات لتصميم الرسومات البيانية ببرنامج 
ستاتا بدمج العناصر مع بعضها بطريقة أكثر وضوحا. 


Moe)‏ بے 
بيانات الدراسات الاستقصانية 


Survey Data 








هذا الفصل يعتبر مقدمة مختصرة للعمل مع بيانات الدراسات 
الاستقصائية باستخدام برنامج ستاتاء القرّاء غير المهتمين بالدراسات 
الاستقصائية» يمكنهم الانتقال إلى الفصول الأخرى» فلن تؤثر عليهم عدم 
قراءتهم لهذا الفصل. ومن ناحية أخرى» المهتمون بالعلوم الاجتماعية والتي 
يعتبر فيها استخدام البيانات الاستقصائية أمرًا في غاية الأهمية» قد يكون من 
المفيد لهم إلقاء نظرة سريعة عن كيفية التعامل مع مثل هذه البيانات. Cd‏ 
الطرق المتقدمة في تحليل البيانات» فسوف تأتي لاحقا في الفصول القادمة. 


بحوث الدراسات الاستقصائية تركز بشكل كبير على رسم اس تدلالات 
صحيحة حول السكان» ونظرياً العينة العشوائية البسيطة هي أفضل وسيلة 
لمثل هذا النوع من الدراسات» ولكن في العادة» فإن هذه الوسيلة مكلفة das.‏ 
ويلا مق استخد اد العينة العشوائية البسيطة يمكن استخدام طرق أخرى 
الل aid Baal Latt,‏ استراتيجيات معينة معقدة لتحقيق أهداف معينة» 
وللحصول على تمثيل معقول لمجتمع الدراسة. كما أنها قد تتطلب إجراء 
بعض التعديلات بعد إجراء عملية المعاينة. وحيث إن الطرق الإحصائية 
المعيارية تقوم على فرضية أن العينة عشوائية بسيطة لذلك فنحن نحتاج إلى 
طرق متخصصة لتصميم بيانات الدراسات الاستقصائية التي يمكن أن تأخذ 
في الاعتبار الحصول على معلومات عن إجراءات المعاينة. 

برنامج ستاتا من البرامج القوية في تحليل بيانات الدراسات 
الاستقصائية؛ معتمداً على مدخل موحد يشمل مجموعة كبيرة من طرق 
التحليل الإحصائي» كل هذه الطرق تعمل من خلال تعريف أساسي لتركيبة 
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العينة والتي يمكن أن تتضمن أوزاناً احتمالية لتقليل التحيز عند اختيار العينة. 
وتصميم العينة يمكن أن يتضمن Lal‏ تعقيدات أخرى مثل تحديد الطبقات 
العنقودية متعددة Sal pall‏ والمجتمعات المحددة؛ في مستوى واحد أو أكثرء 
والمعاينة الإرجاعية» والأوزان التكراريةء ومابعد تحديد الطبقات؛ وعند 
تحديد عناصر التصميم الرئيسة في الدراسة الإستقصائية (باستخدام الأمر 
svyset‏ سوف يتم حفظ مجموعة من البيانات باستخدام المعلومات المعطاة» 
وبعد ذلك يتم التحليل باستخدام الأمر syy‏ الذي سيقوم بتطبيق الأوزان 
ومعلومات التصميم الأخرى تلقائيا كما هو مطلوب. 

أغلب إجراءات الدراسات الاستقصائية يمكن إجراؤها باستخدام القوائم 
والعديد من القوائم الفرعية وذلك باختيار Statistics < Survey data‏ 
85 وللحصول على معلومات أكثر حول أوامر الدراسات 
الاستقصائية» قم بطباعة الأمر help survey‏ كما أن دليل المستخدم Survey‏ 
Cy Data Reference Manual‏ العديد من الأمثلة والتفاصيل التقنية لجميع 
أوامر ستاتا المتعلقة بالدراسات الاستقصائية. المراجع الأخرى المفيدة 
تتضمن كتاباً عن المعاينة للكاتبين Levy and Lemeshow‏ )1999( وكتاب عن 
تحليل بيانات الدراسات الاستقصائية مع أمثلة عن الإحصائيات الحيوية 
للكاتبين Korn and Graubard‏ )1999(« كما أن Sul and Forthofer‏ )2006( يقدمان 
نظرة مختصرة عن المسائل الرئيسة في تحليل بيانات الدراسات 
الاستقصائية. وللاطلاع عن نقاش habe‏ عن مشاكل الأسئلة المفتوحة 
بالدراسات الاستقصائية انظر كتاب Moore‏ (2008). 


أمثلة عن الأوامر : Example Commands‏ 





-svyset n [pweight = censuswt] 

يقوم بتحديد البيانات على أنها بيانات دراسة استقصائية مع أوزان احتمالية 

(نسبي إلى الاحتمال العكسي للاختيار) تم le sac}‏ بواسطة ccensuswt jall‏ 
المحدد n‏ الذي يحدد المشاهدات Àj jill‏ (افتر اضي) كوحدات معاينة رئيسة. 


.Svyset n [pweight = censuswt], strata(district) 
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يُحدد بأن البيانات هي بيانات دراسة استقصائية مأخوذة من عينة طبقية 
ذات مرحلة واحدة» Cus‏ تم تقسيم المجتمع إلى طبقات وأفرادء وتم أخذ Aue‏ 
مستقلة من كل Aih‏ وفي هذا المثال فإن المتغير district‏ يحدد الطبقات» 
والمتغير censuswt‏ يحدد الأو زان الاحتمالية. 


-Svyset school [pweight = finalwt], fpc(nschools) 
|| n, fpc(nstudents) 


يحدد أن البيانات هي بيانات دراسة استقصائية من عينة عنقودية ذات 
مرحلتين» في المرحلة الأولى تم اختيار المدارس بطريقة عشوائيةء لذا فإن 
المدارس هي وحدة المعاينة الأولية. أما في المرحلة الثانيةء فتم خلالها 
اختيار الطلبة بطريقة عشوائية من المدارس التي تم اختيارها في المرحلة 
الأولى؛ وفي كل مرحلة تم تحديد تصحيحات المجتمع المحدد «FPSs)‏ 
فالمتغير nschools‏ يمثل مجموع aae‏ المدارس في المجتمع» والمتغير 
5 يمثل مجموع عدد الطلبة في كل مدرسة. 
.Svy: tabulate vote, percent miss ci‏ 
الحصول على جدول بالنسب المرجحة وحدود الثقة للمتغير vote‏ يتضمن 
القيم المفقودة ely‏ على بيانات دراسة استقصائية -svyset‏ 
.Svy: tabulate vote gender,column pearson lr wald‏ 
الحصول على جدول تقاطعي لار زان المتغير vote‏ مع المتغير gender‏ 
مع نسبة كل عمود للمتغير gender‏ كما أن الجدول سوف يعرض نتائج 
اختبار مربع كاي تربيع لبيرسوء ومعدل الأرجحية كاي تربيع وإحصائيات 
اختبار وولد -Wald test‏ 
.Svy: regress y x1 x2 x3‏ 
يعرض انحدار المتغير ر بالدراسة الاستقصائية مع ثلاثة متغيرات تنبؤية 
وهي x3, 32, x]‏ وللحصول على قائمة كاملة لأنواع أوامر الانحدار وطرق 
التقدير في الدراسات الاستقصائية قم بطباعة الأمر -help svy estimation‏ 


.8vy, subpop(voted): regress y x1 x2 x3 
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يقوم بتحليل الانحدار للدراسة الاستقصائية باستخدام مجتمع ثانوي تم 
تعريفه بواسطة 1 والقيم )0,1( للمتغير cvoted‏ اختيار مجموعة ثانوية من 
البيانات يتم بطريقة اعتيادية من خلال استخدام محددات مثل if‏ أو in‏ وهذا لا 
يعتبر مناسبا عند تحليل الدراسات الاستقصائيةء ولكن بدلا من ذلك يتم 
استخدام الخيارات -subpopO) 5 svy‏ 
.Svy: mean age, over(gender)‏ 
يقوم هذا الأمر بحساب المتوسط المرجح» وفترات AH‏ للمتغير age‏ 
لفئات المتغير gender‏ 


Declare Survey Data : بيانات الدراسة الاستقصائية‎ i 


ii‏ سنة 2001 قام مركز 5 AM‏ جرانيت لاستطلاعات الرأي بجامعة 
نيوهامبشيرء بإجراء دراسات استقصائية عبر الهاتف عدة مرات في كل سنة» 
Lol js JS,‏ قلت بالاتصيال Tages‏ جديدة cS‏ من 50 plas Lait:‏ عق 
آرائهم وعن خلفياتهم. نتائج استطلاعات الرأي السياسية تجذب اهتمام الرأي 
العام كل أربع سنوات خاصة خلال فترة الحملات الانتخابية الرئاسيّة بولاية 
هامبشير» الملف Granite2011_6.dta‏ يحتوي على أسئلة لدراسة اس تطلاعية 
قام بها مركز جرانيت لعدد 516 شخصاً في يونيو 2011. 

.use C:\data\Granite2011_6.dta, clear 


-describe, short 


Contains data from C:\data\Granite2011_6.dta 


obs: 516 New Hampshire, Granite State 
Poll -- June 2011 

ars: 33 2 Jul 2012 06:11 

size: 19,608 


Sorted by: respnum_ 
كما يحدث في أي دراسة استقصائية فإن تصميم المعاينة» ونمط الردود‎ 
Sad عن المجتضع الستهذت»‎ cias lly ule ريما يؤنيان إلى الحصبول‎ 
بيانات التعداد السكاني توضح بأن أقل من %52 من البالغين في الولاية هم‎ 
ولكن النساء يمثلن نحو %55 من نسبة العينة.‎ SLY! من‎ 


.tab sex 
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Gender Freq. Percent Cum. 













Male 
Female 


لتعويض التحيز البسيط في العينة» تقوم بحوث الدراسات الاستقصائية 
بحساب الأوزان الاحتمالية. فبعض هذه الأوزان يتم حسابها من خلال 
المقارنة بين خصائص العينة والمجتمع مثل الجنس في العينة أعلاهء 
والحسابات الأخرى يتم القيام بها ls‏ على خصائص تصميم العينة» بالنسبة 
للباحثين بمركز جرانيت فإنهم يقومون بتعريف المتغير censuswe‏ على أنه 
عبارة عن تجميع لحجم أرباب الأسرء وأرقام «ail sell‏ والجنس» والديانة 
بالولاية. وقيم المتغير censuswt‏ في استطلاع الرأي لشهر يونيو 2011 كان 
متوسطه 1« ولكن المتوسط يتغير من 0.16 (هناك بعض المشاهدات تم 
إعطاؤها أوزاناً مرجحة منخفضة لتعويض التمثيل المرتفع في العينة) إلى 
9 (تم إعطاء أوزان مرجحة مرتفعة لتعويض التمثيل المنخفض في 
العينة). 


.summarize censuswt 


Variable Obs Mean Std. Dev. Min Max 
SE 516 -9991743 .4601123 .1603937 2.194549 
يحدد أن البيانات الموجودة هي بيانات دراسة استقصائية»‎ ssvyset الأمر‎ 
وحفظ هذه البيانات» ثم‎ ccensuswe مع إعطاء أوزان احتمالية بواسطة المتغير‎ 
حفظ هذه المعلومات يعتبر مهماً بالرغم من إمكانية استخدام الأوزان في أي‎ 
تحليل إحصائي عند الحاجة إلى ذلك في تحليل معين» ما عدا ذلك فإن هذه‎ 

البيانات لن تتغير. 
.svyset | n [pweight = censuswt]‏ 


pweight: censuswt 
VCE: iinearized 
Single unit: missinc 
Strata 1: «one» 
SY 1: «observations» 
FPC 1: «zero» 
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.save, replace 
.svydescribe 
Survey: Describing stage 1 sampling units 


pweight: censuswt 
VCE: linearized 
Single unit: missing 
strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


#Obs per Unit 





Stratum #Units #0bs min mean max 
1 516 516 1 1.0 1 
al 516 516 1 1.0 1 


عند تحديد بيانات Aut pall‏ الاستقصائية باستخدام الأمر «svyset.‏ فإن 
الأوامر التي تبدأ ب رهه سوف تقوم بإجراء الحسابات الإحصائية مستخدمة 
معلومات وزن الدراسة الاستقصائية» وبعد ترجيح تمثيل الجنس بالعينة ليكون 
أقرب للقيمة المتوقعة في المجتمع. 

.Svy: tab sex 


(running tabulate on estimation sample) 










Number of strata = 3 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 5415 
Gender proportions 
Male .4965 
Female .5035 
Total 
Key: proportions = cell proportions 


العديد من أوامر ستاتا من الجداول البسيطة إلى النماذج الإحصائية 
تسمح بإضافة : syy‏ قبل الأمر. فمثلاً يمكننا حساب الانحدار المنطقي 
المرجح (في الفصل 9) لوجهات النظر الفردية حول التغير المناخي - 
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المتعلقة بالمتغير warmop2‏ — مع مستوى تعليم المشارك في الدراسة وحزبه 
السياسي من خلال الأمر التالي: 
.Svy: logit warmop2 educ party‏ 

للحصول على قائمة بالاحتمالات التحليلية» قم بطباعة الأمر chelp survey‏ 
الأمر svyset‏ يمكنه أن يحدد معلومات أكثر على أنها معلومات دراسة 
استقصائية بطرق أخرى مختلفة عن تلك التي سبق أن رأيناها في الأمثلة 
السابقة» فخيارات الأمر svyset‏ تسمح ll‏ بإنشاء تصميمات معقدة» تتضمن 
معاينة عنقودية متعددة al pall‏ وطبقية وتصحيح المجتمع المحدد وطرق 
بديلة لتقدير التباين وإضافة طبقات جديدة. وللحصول على قائمة كاملة 
بالخيارات المتوافرة وتركيباتهاء قم بطباعة الأمر help svyset‏ كما أن دليل 
المستخذم Survey Data Reference Manual‏ يشر ح أمثلة وتقنيات عن هذا 
الموضوع بشكل أكثر تفصيلاً. 
تصميم Design Weights : OljgUl‏ 

üa تغريفات الأوزاق كم علماتك. والعتيد‎ AE TET ER 
تم حساب أوزانها‎ ALIS مستخدمي البيانات يبدأون عملهم ببيانات استقصائية‎ 
مسبقاً. هذا الجزء والأجزاء القادمة» سوف تعرض أمثلة توضح كيفية حساب‎ 
الأوزان.‎ 

الباحثون الذين يستخدمون بيانات الدراسات الاستقصائية يطبقون 
الأوزان الاحتمالية لضبط التحيز في طرق المعاينةء فقد يظهر التحيز نتيجة 
عاملين اثنين هما خصائص متعمّدة في تصميم المعاينة أو خصائص مضافة 
بشكل غير مقصود eti‏ عملية جمع البيانات» وكلا العاملين يؤديان إلى 
الحصول على عينة غير ممثلة للمجتمع» ولاتعطي صورة واقعية عن تقلبات 
العينة وخصائص المجتمع. 

بالنسبة لمركز جرانيت لاستطلاع الرأيء فإن الباحثين يقومون بالاتصال 
بعينة عشوائية من سكان نيوهامبشير عن طريق الماتف» ونظرياً أرقام 
الهاتف العشوائية يمكن أن تنتج عينة عشوائية من سكان الولاية؛ فعند إجراء 
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استطلاعات عن الانتخابات أو أي موضوع آخرء فإن الباحث يريد تعميم 
نتائجه ليس فقط على السكان الذين تم الاتصال بهم ولكن على كل الناخبين 
الذين يعيشون في الولاية. فبعض السكان هم من البالغين فقطء وبعضهم 
الآخر مختلط. بين المجيبين عن الاتصالات الهاتفية لاستطلاع يونيو 2011 
هناك نحو %29 قالوا إنهم يعيشون في بيت به شخص بالغ واحد فقط. 
الإجابات في هذا المثال محددة: "واحدء اثنين» ثلاثة أو أكثر". وهذا شيء 
عملي للمقارنة بين الأوزان الترجيحيةء هناك 503 أشخاص hä‏ من Jal‏ 
6 قاموا بالإجابة عن سؤال عدد البالغين في البيت؛ موق Lus àpd‏ 
للذين لم يجيبوا عن هذا السؤال وعددهم 13 شخصاً. 

.tab adults 


# adults in 
household Freq. Percent Cum. 





بالرغم من أن %29 من أفراد العينة يعيشون في بيت به شخص بالغ 
واحد» فإنه من الخطأ توقع نفس النسبة لكل سكان ولاية هامبشير. ولاختيار 
شخص واحد بطريقة عشوائية عند إجراء الاتصالات الهائفيةء الباحث الذي 
قام بالاتصال سوف يسأل عن شخص بالغ في البيت للحديث cigs J (Axa‏ 
يقوم بالاتصال في وقت آخر عند عدم الرد على الهاتف» هذا يؤدي إلى أن 
البيوت التي يعيش فيها شخص بالغ واحد أقل احتمالاً بثلاث مرات أن يدخلوا 
في العينة مقارنة بالبيوت التي يعيش فيها ثلاثة بالغين أو أكثر. الج كول 
أعلاه» يوضح بأنه يجب عد المكالمات الهاتفية لكل البيوت التي يجب أن 
تكون على الأقل Lass 940=(82x3)+(273x2)+ (148x1)‏ بالغاً. في 
هذه العينة الوهمية الذين يعيشون في بيت به شخص بالغ واحد يمثلون 
940-148 أو نسبة %16 وهي أقل بكثير من نسبة 9629 بالجدول أعلاه. 
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أوزان الدراسات الاستقصائية تعتبر طريقة لتصحيح التحيز في العينةء 
كما أنها تساعد في الحصول على نتائج أكثر واقعية. في هذا المثال الأوزان 
مهمة ليس فقط لشرح عدد السكان في egal BY fags Lead Lal, NY‏ 
أخرى مثل السلوك الانتخابي الذي قد يرتبط بحجم السكان. فوجود شخص 
بالغ واحد في المنزل؛ ربما يرتبط بنسبة كبيرة من Guill GUS‏ الذين يعيشون 
وحدهم» ووجود شخصين بالغين في المنزل يعني وجود العديد من الأسر 
الشابة» ووجود Bac‏ أشخاض بالغين دلالة على أن العائللات مسنة أو وجود 
بالغين شباب مع أصدقائهم يعيشون في المنزل. 
الأوزان الاحتمالية تتناسب مع معكوس احتمال الاختيار. ففي المتال 
أعلاه الاحتمال الشرطي لاختيار شخص معين من منزل به شخص بالغ 
واحد (بافتراض Lil‏ قمنا بالاتصال بذلك المنزل) يساوي واحدء واحتمال 
اختيار شخص معين من منزل به شخصان بالغان يساوي 2/1 ومن منزل 
به ثلاثة أشخاص بالغين 3/1. وإذا قمنا باستخدام معكوس هذه الاحتمالات 
i2 »1‏ 3 كأوزان» فإن العينة سوف تتضمن 940 شخصاً وهمياً ولكن هذا 
سوف يقود إلى مجاميع غير صحيحة» ويسبب le yi‏ من الالتباس» وللحفاظ 
على حجم العينة الصحيح يمكننا ضرب معكوس الاحتمالات في نسبة 
الأشخاص الحقيقيين إلى الوهميين 940/503 فإن هذه الخطوة سوف تقوم 
بإنشاء متغير جديد باسم adultwt‏ وهو يحتوي على الأوزان الاحتمالية 
لتصحيح تحيز العينة المعروف» مع Bial‏ على حجم العينة الأصلي. 
الأوزان تساوي 0.535 (شخص بالغ واحد JS‏ منزل)» 1.070 (شخصان 
بالغان (Jj JS‏ 1.605 (ثلاثة أشخاص أو أكثر بالغين JS‏ منزل)» القيم 
المفقودة سوف تأخذ الوزن المحايد وهو 1ء ونسبة هذه الأوزان تظل 3:2:1 
.generate adultwt - adults*(503/940)‏ 
.replace adultwt - 1 if missing(adultwt)‏ 
.tab adults, summ(adultwt) miss‏ 


# adults in 
household 


Summary of adultwt 
Mean Std. Dev. 















53510636 0 
2 1.0702127 0 213 
1.6053191 0 82 
1 0 13 


99999997 - 35080553 516 
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إذا كان هذا التعديل مرغوباً cd‏ فيمكننا استخدام الأمر svyset‏ مع بيانات 
المتغير adultwt‏ كأوزان احتمالية. 
.Svyset n [pw = adultwt]‏ 


pweight: adultwt 
VCE: linearized 
Single unit: missing 
Strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


.Svy: tab adults, percent 


(running tabulate on estimation sample) 





Number of strata  - 1 Number of obs - 503 
Number of PSUS = 503 Population size = 502.99998 
Design df = 502 
# adults 
in 
household percentages 
1 15.74 
2 58.09 
3+ 26.17 
Total 100 
Key: percentages - cell percentages 


9629 سن‎ Yap بالمتزل‎ sal من خسن‎ 9616 Ui) 345 casa 
كما في البيانات الخام) يعطي صورة أكثر واقعية.‎ 
Poststratification Weights : الأوزان اطرجحة الطبقية الزاحقة‎ 

الجزء السابق في هذا الفصلء قدّم مثالاً على الأوزان المرجحة بناءً 
ce‏ تصميم المعاينة» والتي كانت معروفة قبل تصميم عملية جمع البيانات. 
النوع الثاني من الأوزان المرجحة يمكن تعريفه بعد جمع البيانات. فبالرغم 
من توخي الدقة عند جمع البيانات» فإنه من الممكن أن البيانات لا تمثل بعض 
خصائص المجتمع؛ فمثلا قد يكون هناك اختلاف واضح بين توزيع العمر أو 
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الجنس في العينة عند توزيع المجتمع المستهدف» مما يجعل النتائج عرضة 
للتساؤل» فالتوزيع الطبقي اللاحق» يشير إلى الأوزان الاحتمالية المحسوبة 
حتى تكون نسب مجموعات معينة أو طبقات في العينة قريبة بدرجة معقولة 
لما هو موجود في المجتمع. 

ففي عينة مركز cud a‏ لاستطلاع الرأي؛ كانت نسبة الإناث 
5 ؛ ولكن حسب تعداد السكان لسنة 2010 نسبة الإناث البالغات 
بولاية هامبشير %51.6 فقطء وإذا أظهرت نتائج الدراسة الاستقصائية بأن 
نسبة SLY!‏ بالمجتمع %54.65 فهذا يكون Lin gin‏ كبيرا عن الواقغ. 
بالإضافة إلى cells‏ فقد نحصل على نتائج خاطئة حول العناصر الأخرى 
المرتبطة بالجنس مثل الانتخاب. هذا التحيز الواضح في عدد الردود يمكن 
أن يؤثر على قدرتنا في الحصول على استدلالات صحيحة في مجتمعات 
أكبر. 





.tab sex 








Gender Percent 





Male 
Female 


هناك العديد من الطرق للوصول إلى التقسيم الطبقي اللاحق (الطريقة 
aid. gh old cua pal og ull ci Ala‏ الأبى Ji (gill avyset‏ 
خيار poststrata‏ الذي ثم شرحه بالتفصيل بددليل المستخدم Survey Reference‏ 
(Manual‏ إذا كنا نعرف نسب المجتمع الصحيحة للمتغيرات الرئيسة - كما 
Lhe’‏ سابقاً بخصوص الجنس بالمثال أعلاه فان أوزان تصحيح تحيز 
pls, aay eite‏ مق خلال cud‏ في افيص طن عسي ال JL‏ 
فمثلاً متغير الجنس sex‏ تم ترميزه بحيث يساوي 0 للذكور» وهم يمثلون 
Edge ducent‏ في المجتمع بولاية هامبشيرء ولكن نسبتهم في العينة 
هي 5 فقط وليس هناك أي قيم مفقودة لمتغير الجنس sex‏ في بيانات 
العينة. 
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يمكننا حساب الأوزان حيث إنها أعلى من 1 بقليل 48.4 + 45.35 - 
7 للذكورء Ld‏ للإناث فهي JÍ‏ من 1 بقليل 0.944=54.65+51.6 

.generate sexwt = 48.4/45.35 if sex==0 

.replace sexwt - 51.6/54.65 if sex--1 

.tab sex, summ(sexwt) 


Summary of sexwt 
Mean Std. Dev. Freq. 









Gender 





1.0672547 0 234 
. 94419032 


Male 
Female 








- 06132481 





-99999857 


إذا استخدمنا الأمر svyset‏ مع بيانات المتغير serwi‏ كوزن احتمالي» فإن 
الخيار 509:45 يقوم بإنتاج جدول مرجح يعرض النسب الحقيقية للذكور وهي 
4 وللإناث %51.6. بعد حساب الأوزان الطبقية اللاحقة من الأفضل 
فحص ما إذا كانت الأوامر قد قامت بوظيفتها كما ينبغي أم لا؟ 


.Svyset [pw = sexwt] 


pweight: sexwt 
VCE: linearized 
Single unit: missing 
Strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


.Svy: tab sex, percent 


(running tabulate on estimation sample) 


Number of strata = 1 Number of obs = 516 
Number of PSUS = 516 Population size = 515.99926 
Design df = Bib 













Gender percentages 


Male 
Female 51.6 
Total 


Key: percentages = cell percentages 
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من الممكن حساب أوزان طبقية لاحقة أخرى باتباع طريقة Aelia‏ 
فمثلاً إذا افترضنا أنه في دراسة أخرى نريد تقدير توزيع العمر والعرق 
والجنس في المجتمع» فيمكن أن يتم ذلك باتباع الخطوات التالية: 

1- إنشاء جدول لنسب العمر والعرق والجنس من تعداد سكاني أو بيانات 
أخرى axe Sie‏ البالغين القاطنين بالمنزل عن المجتمع المستهدف» فإذا 

قمنا باستخدام خمس مجموعات للعمر (29-18: 39-30.. الخ) 

ومجموعتين للعرق (أبيض» غير أبيض) فإن النتائج سوف تكون في 20 

رقم (2x5)‏ مثل نسبة البالغين البيض الذكور في المجتمع في مجموعة 

29-8 سنة» أو نسبة SLY!‏ البيض في مجموعة 29-18 سنة وهكذا. 
2- الحصول على جدول مشابه للجدول السابق يوضح نسب العمر والعرق 

والجنس من المثال» فمثلاً عند إنشاء متغير جديد باسم ARS‏ يجمع بين 

العمر والعرق والجنس وإنشاء جدول له: 


.egen ARS = group (agegroup race sex), 
lname (ars) 
.tab ARS 


3- تعريف مجموعة أوزان جديدة باستخدام الأمر generate ... if‏ فعلى 
سبيل المثال» بافتراض أننا نعلم بأن %8.6 من عدد السكان البالغين في 
منطقة هذه الدراسة هم من الذكور البيض في مجموعة 29-18 سنةء 
وأن نسبة %8.2 هم من GLY!‏ البيض في نفس المجموعةء ولكن في 
العينة غير الموزونة نرى أن نسبة %2.6 من الذكور البيض في 
مجموعة 29-18 سنة وأن نسبة الإناث البيض %5.1 مما يعني أن 
الذكور يشكلون Anal‏ الأكبر في عدد البالغين» وهذا لا يمثل النسب 
الحقيقية بالمجتمع؛ يمكننا إنشاء متغير موزون جديد للعمر والعرق 
والجنس يسمى ARSwt‏ يساوي 1 (وهو الوزن المحايد)ء وإذا كنا لا 
نعرف عمر وعرق وجنس المشارك في الدراسة» وغير ذلك فإنه 
يساوي نسبة المجتمع. وقسمة نسبة العينة بالنسبة لمجموعة العمر 
والعرق والجنس كما يلي: 


generate ARSwt = 1 if ARS»- . 
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.label variable ARSwt "Age-race-sex weights" 
.replace ARSwt = 8.6/2.6 if ARS == 1 
.replace ARSwt = 8.2/5.1 if ARS == 2 


تصحيح التقسيم الطبقي اللاحق طريقة مفيدة عند العمل مع دراسات 
استقصائية مصممة تصميماً جيداء ويجب ألا يُفهم هذا على أنه علاج 
للخطاء التي تحدث في المعاينة بالصدفة. مثل هذه التصحيحات يمكن 
تطبيقها بشكل كبير على دراسات استطلاع رأي الناخبين» والدراسات 
الاستقصاتية بالعلوم الاجتماعية التي تتطلب مجهوذا كبيرًا الحصول على 
عينة ممثلة للمجتمع. وهناك بعض الدراسات التي تبحث عن دليل مستقل مثل 
نتائج الانتخاب أو التي يتم القيام بها من جديد من قبل باحثين آخرين»ء فهذه 
تعتبر اختبارات حقيقية عن مدى نجاح التصحيحات. 
بيانات دراسة واحدة قد تتضمن وزن متغيرات تم حسابها من أكثر من 
مصدرء متل تصميم الأوزان» والأوزان الطبقية اللاحقةء ولدمج هذه 
المتغيرات في متغير مرجح عام daly‏ نقوم بضرب ثم نقوم بعمل تصحيح 
حتى يكون المجموع النهائي للأوزان يساوي حجم العينة. فعند وضع الأمر 
quietly‏ قبل الأمر summarize‏ فإننا نطلب من ستاتا حساب الإحصائيات 
المختصرة؛ ولكن لا تعرض النتائج توفيراً للوقت. واستخدام الأمر quietly‏ 
مع الأوامر الأخرىء فإنه سوف يقوم بنفس المهمة. 
.generate finalwt - adultwt*ARSwt‏ 
.replace finalwt = 1 if finalwt»- .‏ 


.quietly summarize finalwt 
.replace finalwt = finalwt*(r(N)/r(sum)) 


يمكن وجود أي عدد من المتغيرات المرجحة في نفس مجموعة البيانات» 
واستخدام الأمر svyset‏ باستمرار لاختيار أي متغيرات لإجراء تحليل معين» 
الأوزان تتأثر في التحليل عند تطبيقها فقط باستخدام الأمر syy‏ أو تحديد 
أوامر ترجيح أخرى. خلال بقية هذا الفصل» سوف نرجع إلى بيانات 
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استطلاع الرأي لمركز جرانيت» ونقوم بترجيحها بواسطة المتغير censuswt‏ 
وهو متغير ثم حسابه بواسطة مركز الاستطلاع بجامعة نيوهامبشير 
بالولايات المتحدة لتوحيد تصميم الأوزان (لعدد البالغين» وعدد خطوط 
الهاتف)» مع تصنيف طبقي لاحق (للجنس والمنطقة بولاية هامبشير). 
.Svyset n [pw = censuswt]‏ 
pweight: censuswt‏ 
VCE: linearized‏ 
Single unit: missing‏ 
Strata 1: «one»‏ 


SU 1: «observations» 
FPC 1: «zero» 


: والجداول اطورونة للدراسات الاسنقصائية‎ aul الرسومات‎ 
Survey-Weighted Tables and Graphs 

استطلاع يونيو 2011 لمركز جرانيت» يتضمن ستة أسئلة تتعلق 
بالاحتباس الحراريء أو التغير المناخي. مجموعة من هذه الأسئلة كانت 
حقيقية» ولكن (warmop) à al g‏ كان Ue‏ هو اعتقادك الشخصي؟ 

أي من العبارات الثلاث التالية تعتقد أنها صحيحة؟ 

- التغير المناخي يحدث الآن وسببه الرئيسي الأنشطة البشرية. 

- التغير المناخي يحدث الآن ولكن سببه الرئيسي القوى الطبيعية. 

- التغير المناخي لا يحدث الآن. 

الباحث قام بتغيير ترتيب خيارات الإجابات لتفادي احتمالية التحيّز. نحو 
5 وافقو! بأن التغير المناخي يحدث الآن وسببه الرئيس الأنشطة البشرية» 
وآخرون يعتقدون ob‏ التغيرات كانت لأسباب طبيعية )%35( قليلون 
يعتقدون بأن التغير المناخي لا يحدث GY)‏ )%3( 


.Svy: tab warmop, percent ci 
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(running tabulate on estimation sample) 


Number of strata = al Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 








Personal 
belief 
about 
climate 
change 









percentages 


DK/NA 


Not now 3.05 1.904 4.853 
Now/natu 34.62 30.2 39.32 
Now/huma 54.89 50.11 59:58 


Total 
Key: percentages cell percentages 


1b = lower 95% confidence bounds for cell percentages 
ub - upper 95$ confidence bounds for cell percentages 


الأمر svystab‏ : يُطبق الأوزان بناءً على معايير تم تحديدها سابقاً 
بواسطة الأمر csvyset‏ والخيار ك يحدد فقرات الثقة للنسبة الموزونة 
ويعرضها كحدود سفلى وعليا (الحد الأدنى 15 والحد الأعلى «(ub‏ وبناء على 
هذه العينة فإننا على درجة A‏ 9695 بأنه ما بين 9650.11 و 9659.58 من 
البالغين بولاية هامبشير يعتقدون بأن الأنشطة البشرية تقوم بتغيير المناخ. 
el si‏ الرسومات البيانية الأصلية ببرنامج ستاتا ليست مناسبة لععرض 
توزيعات المتغيرات الطبقية مثل المعروضة بالجدول eel‏ لحسن الحظ 
هناك برنامج يمكن للمستخدم كتابته اسمه catplot‏ - تم شرحها في مجلة 
ستاتا Stata Journal‏ للكاتب كوكس (Cox 2004b)‏ — يقوم odes‏ الوظيفة بطريقة 
جيدة» ويمكنك الحصول على الملفات التنفيذية 40-5165 لهذا البرنامج من 
الإنترنت وذلك بطباعة الأمر 
.findit catplot‏ 
وتابع الروابط لتحميل وتثبيت هذه البرامج على جهاز الكمبيوتر لديك» 
(الأمر findit‏ يعمل مع مئات من البرامج المكتوبة بواسطة المستخدمين) وعند 
إنهاء التثبيت قم بطباعة الأمر help catplot‏ لعرض تركيبة الأمر وخياراته؛ 
الشكل )1.4( يحتوي على رسم بياني عمودي للمتغير -warmop‏ وبالرغم من 
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أن الأمر Y catplot‏ يقبل وضع الأعمدة البيانية في وضع عمودي ويقبل 
الأعمدة Aga)‏ فقط» فإن إضافة الخيار [aweights = censuswi]‏ في هذا الأمر 
يجعل له نفس التأثير المرئي لكي تكون الأعمدة في وضع عمودي وليس أفقيا 
موضحة النسب .svy: tab åy gial)‏ 


.catplot bar warmop [aweight = censuswt], percent 


e 
«o 


percent 


DK/NA Not now Now/natural Now/human 


الشكل )1.4( 


الرسم البياني العمودي مع توصيفات القيم في العادة أسهل للقارئ من 
الوضع الأفقي بتنسيق (hbar)‏ وخصوصا عندما يكون لدينا العديد من 
الأعمدة. الشكل (2.4) يعرض Waa‏ اف تسن Ll ge‏ وتوصيفات 
للمحاور بشكل مناسب للنشر في التقارير أو لعرض نتائج الدراسة 
الاستقه AL‏ يمكننا توصيف الأعمدة حتى يمكن قراءة النسب المرجحة 
مباشرة من الرسم البياني» وهناك نفس العدد تم إيجاده بواسطة الأمر أعلاه 
:Svy: tab‏ 


.catplot hbar warmop [aweight- censuswt], percent 


blabel(bar, format(?*3.0£)) ytitie("Weighted 
percent") 


title("Personal belief about climate change") 
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الإحصاء مع برنامج ستاتا 





Personal belief about climate change 


DK/NA 7 


Not now 3 


Now/natural 35 


Now/human 


Personal belief about climate change 


0 40 
Weighted percent 


الشكل )2.4( 


كيف يمكن للتغير المناخي أن يكون متعلقاً بالمتغيرات الأخرى في 
الدراسة الاستقصائية» مثل مستوى تعليم المشارك بالدراسة f(educ)‏ يمكننا 
إجابة مثل هذه الأسئلة من خلال الجداول الثنائية. 


511 
510.02315 
510 


.Svy: tab warmopeduc, col percent 


(running tabulate on estimation sample) 


Number of strata = 1 Number of obs 
Number of PSUs = 511 Population size 
Design df 









Personal 


belief 

about 

climate Highest degree completed 

change HS or le Tech/som College Postgrad Total 












DK/NA 


Not now 5.154 2.694 2.694 1,991 3.083 
Now/natu 33.55 42.81 37.29 24.79 34.71 
Now/huma 51.35 42.23 55.41 69.18 54.68 


Total 


Key: column percentages 


Pearson: 
Uncorrected chi2(9) = 25.1986 
Design-based F(8.81, 4495.16)= 2.4226 P = 0.0102 
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في المثال أعلاه, قمنا بإنشاء عمود للنسب المئوية» oy‏ عمود المتغير 
(educ)‏ يشكل Situs V xia‏ في هذا التحليل» التحليل يوضح أن نحو %69 
هم من حملة شهادة دراسات «Postgrad Ule.‏ 7655 خريجو كليات «College‏ 
72 جامعي لم يكمل دراسته أو درس في معهد تقني (Tech/some‏ جميعهم 
يعتقدون بأن التغير المناخي يحدث الآن وسببه الرئيس Agila ee‏ 
والتصميم المرجح لاختبار F‏ في الجدول أعلاهء يؤكد على أن العلاقة بين 
التغير المناخي» ومستوى التعليم ذو معنوية إحصائية (0.102=م). 
osa‏ )4 .3( يعرض رسما ids‏ من نوع catplot‏ المتغير warmop‏ 
موضحاً الردود لكل مستوى تعليمي للمشاركين» معطياً نسباً مئوية مرجحة. 
fos‏ “سهم cadi» b‏ السب ndi‏ حصب Lj ga A‏ 
التعليم educ‏ والخيار title‏ تم استخدامه كخيار فرعي مع المحدد byQ‏ ولكي 
نحصل على عنوان واحد للرسم البياني ككل» يمكنك اختبار ذلك لتترى ما 
سيحدث بدون استخدام هذه الخيارات. 
.catplot hbar warmop [aweight = censuswt],‏ 


percent (educ) 
by(educ,title("Personal belief about climate 


change")) 
blabel(bar, format (%3.0f)) ytitle("Weighted 
percent") 
Personal belief about climate change 
HS or less Tech/some coll 
DK/NA 10 DK/NA 12 
Not now 5 Not now fj 3 
Now/natural 34 Now/natural 43 
Now/human 51 Now/human 42 
College grad Postgrad 
DK/NA M 5 DK/NA M 4 
Not now § 3 Not now ff 2 
Now/natural 37 Now/natural 25 
Now/human 55 Now/numan 69 


0 20 40 60 


Weighted percent 


الشكل )3.4( 


Graphs by Highest degree completed 
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مخططات الاعمدة البيانية للمقارنات obl‏ : 

Bar Charts for Multiple Comparisons 

الرسم البياني للأعمدة catplot‏ في الشكل )3.4( يوضح العلاقة بين 

متغيرين» كل منهما يحتوي على أربع فئات. وإذا كان لدينا أكثر من متغيرين 


3 عدد كبير من الفئات» فإن استخدام الأمر catplot‏ يصبح معقداء البديل 
SOD‏ :وكا ni Aay‏ المتعددة للمتغيرات هو استخدام الأمر 
hbar‏ لإنشاء الأعمدة الأفقية 

الشكل )13.3( في الفصل السابق» تتبع التغيرات في جليد القطب 
الشمالي في نهاية Eai‏ الصيف للفترة من . 1979 -2011 الانخفاض الكبير 
في نسبة الجليد جذب انتباه الكثير من العلماء وتم ملاحظته من قبل العامة في 
النشرات ووسائل الإعلام المختلفة» وقد قام مركز جرانيت لاستطلاع الرأي 
بتضمين سؤال Qwarmice)‏ تم صياغته بعناية لاختبار مدى معرفة الناس عن 
هذه المشكلةء مع إضافة هذا السؤال تم تغيير cas‏ الإجابات لتجنب التحيزء 
الأغلبية الساحقة )%71( تعلم عن انخفاض الجليد بالقطب الشمالي. 

أي من العبارات الثلاث التالية تعتقد أنها الأكثر دقة؟ 

خلال السنوات القليلة الماضيةء الجليد في القطب الشمالي في نهاية 
الصيف: 
- يغطي منطقة أقل عن التي كان يغطيها منذ 30 سنة مضت. 
- انخفض ولكن عاد لنفس المنطقة تقريباً آلتي GIS‏ يغطيها Aia 30 Ste‏ 


5 


مصث. 


- يغطي مذ منطقة أكثر من التي كان ي يغطيها منذ 30 سنة مضت. 


.Svy: tab warmice, percent ci 
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(running tabulate on estimation sample) 


Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 








Arctic 
ice vs. 

30 years 
ago 











percentages 


Less 


Recovere 10.43 7.784 13.83 
More 6.916 4.841 9.789 
DK/NA 11:75 8.991 15.21 


Total 


cell percentages 
lower 95$ confidence bounds for cell percentages 
upper 95$ confidence bounds for cell percentages 


Key: percentages 
1b 
ub 


سوال iwarmice‏ يسح بأربعة خيارات تتضمن "لا أعرف" “don’t know”‏ 
أل لا ass ial‏ عض )24 cial‏ فإنة من اد إا متي ipie‏ لذي 
قرعن يقير إلى عا إذا كان الشاركرن قد Lola‏ حن السؤال بقل qaa‏ 
المتغير warmiceQ‏ يساوي 1 للإجابات التي قالت بأن الجليد انخفضء 0 لجميع 
الإجابات الأخرى» نحو %71 أجابوا بشكل صحيح» وكانت إجاباتهم أن الجليد 
في نهاية الصيف يغطي منطقة أقل من تلك التي كان يغطيها منذ 30 سنة 


5 


مضت . 


.gen warmiceQ = 0 

.replace warmiceQ = 1 if warmice== 

.label variable warmiceQ "Know Arctic ice area 
declined" 

.Svy: tab warmiceQ, percent ci 
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(running tabulate on estimation sample 


Number of strata = L Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 








Know 
Arctic 

ice area 
Geclined 





percentages 


- cell percentages 
lb = lower 95% confidence bounds for cell percentages 


Key: percentages 


ub upper 95% confidence bounds for cell percentages 


المتوسط }0,1{ لمتغير معين مثل 0 يساوي نسبة من قيم 
1 الصحيح» فمثلاً المتغيرات الوهمية (0,1) لها العديد من الاستخدامات في 
النماذج الإحصائية. فعند إنشاء الرسومات البيانية فقد يتم إعادة قياس المتغير 
warmiceQ‏ لتكون قيمه 9 أو 100 فالمتغير الذي متوسطه }0,100{ يساوي 
نسباً مثوية. وفي المثال أعلاه فهو يساوي النسب المئوية للإجابات الصحيحة 
حول الجليد في القطب الشمالي؛ وعند تطبيق graph hbar yaY!‏ على تقسيم 
ثنائي .)0,100( فيمكننا مقارنة أشكال العديد من النسب Ay shall‏ الشكل )4.4( 
يعرض النسب المرجحة للإجابات الصحيحة لخريجي الجامعات وخريجي 
المؤسسات الأخر ى (المتغير (college‏ 
.gen warmiceQ100 = warmiceQ*i00‏ 


.graph hbar (mean) warmiceQ100 [aw - censuswt], 
over(college) 


blabel (bar, format(%3.0f)) ytitle("Weighted 
percent") 


title("Arctic ice declined, by college 
grad/other") 
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Arctic ice declined, by college grad/other 


Non college 





College 


0 20 40 60 80 
Weighted percent 


الشكل )4.4( 


لاحظ أن الرسم البياني للأعمدة الأفقية graph hbar)‏ و Leal‏ في graph‏ 
chbox‏ وفي بعض الأشكال البيانية الأخرى التي تم تغيير اتجاهها) المحور 
الأفقي يسمى محور ey‏ وهذا مخالف لما هو متعارف عليه؛ « Oc at‏ 
gic May ytitle(“Weighted percent”)‏ انا للمحور الأفقي وهو يظهر في 
أسفل الرسم. فبرنامج ستاتا لا cS‏ على محور × في مثل هذه الأشكال 
بالرغم من أن الخيار( )1141016 يمكنه تحديد عنوان يظهر في الجانب الأيسر 
للشكل البياني. 

"شكل )4.4( يقارن بين نسبتين فقط وهي نسبة %76 التي تمثل نسبة 
خريجي الجامعات ونسبة 5 التي تمثل خريجي المؤسسات الأخرى. لا 
أعتقد أن هناك شخصاً يريد إنشاء مثل هذا الرسم البياني لإجراء مثل هذه 
ry‏ البسيطة» ولكن طريقة رسم الأعمدة يمكن تحسينها لإجراء مقارنات 
AS‏ تعقيداً. فالدراسات الاستقصائية السابقة وجدت أن هناك اختلافات 
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متحيزة في العديد من الأسئلة التي تتعلق بالتغير المتاخي» وقد توجد هذه 
المشكلة في Qi Sl‏ السابق المتعلق بالجليد في القطب الشمالي. والشكل 
)5.4( يعرض أعمدة بيانية لثلاثة متغيرات تعطي نسبة الإجابات الصحيحة 
وتم تقسيم هذه النسب لتمثل التعليم الجامعي والانتماء السياسي (متغير (party‏ 
.graph hbar (mean) warmiceQ100 [aw = censuswt],‏ 
over(college) over(party)‏ 

blabel (bar, format(%3.0£)) ytitle("Weighted 
percent") 


title("Arctic ice declined, by college and 
political party", size(medium) ) 


Arctic ice declined, by college and political party 


Non college 82 
Democrat 
College 85 
Non college 63 
Independent 
College 81 
Non college 52 
Republican 
College 62 
وده‎ oo — T 
0 20 40 60 80 
Weighted percent 
(5.4) الشكل‎ 


لكل مجموعة أحزاب بالمتغير party‏ يمكننا أن نرى تأثير التعليم 
الجامعي ولكل مستوى تعليمي» يمكننا أيضا أن نرى الاختلافات المتحيّزة. 
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الشكل (5.4) لا يستطيع أن يوضح لنا أن الاختلافات هي اختلافات 
إحصائية ذات معنوية إحصائية» فالإجابة عن ذلك تتطلب استخدام أدوات النماذج 
الإحصائية التي سوف يتم تقديمها في الفصل (9)؛ كما سبق وأن رأيناء فإن 
نموذج الانحدار اللوغاريتمي المرجح يؤكد Gh‏ كلا من المتغير college‏ والذي 
يمثل التعليم الجامعي» والمتغير party‏ والذي يمثل الانتماء السياسي لها تأثيرات 
إحصائية ذات معنوية» وهذا التأثير موجب في حالة college‏ )0 = غير الجامعي 
cnon-college‏ 1 = الخريج الجامعي (college grad‏ وسالب في حالة party‏ )] 7 
الديمقراطي «Democrat‏ 2= للمستقل «Independent‏ 3 = للجمهوري «(Republican‏ 

college والانتماء السياسي عامل تنبؤي أقوى من‎ 
.Svy: logit warmiceQ college party 


(running logit on estimation sample) 





Survey: Logistic regression 


Number of strata = 1 Number of obs = 501 
Number of PSUs = 501 Population size = 500.96122 
Design df = 500 
F( 2, 499) = 16.07 
Prob > F = 0.0000 

Linearized 
warmiceQ Coef. Std. Err. t P>|t| (95% Conf. Interval] 
college - 4634607 + 2264922 2.05 0.041 .018467 .9084544 
party -.6669759 .1268445 -5.26 0.000 -.9161897 -.4177621 
cons 2.058491 -3162993 6.51 0.000 1.437052 2.679931 


سوف نعود لهذا المثال في الفصل 9( حيث سوف يتم تطبيق طريقة 
إحصائية (اللوغاريتم المتعدد) ويمكن إدراجها في نموذج تنبؤ لكل إجابة عن 
السؤال الخاص بمناطق الجليد. 








الملخصات الاخصائية والجداول 


Summary Statistics and Tables 








الأمر :summarize‏ يقوم بإنشاء إحصائيات وصفية مختصرة: مثل 
الوسيط والمتوسط والانحراف المعياري للمتغيرات. وهناك طرق أخرى 
لإنشاء الملخصات الإحصائية للمتغيرات الأخرى» وذلك باس تخدام الأمر 
.tabstat‏ بالنسبة للمتغيرات الطبقية والترتيبية» OM‏ الأمر tabulate‏ يقوم 
بإنشاء جدول للتوزيع التكراري» والجداول التقاطعية» ومجموعة من 
الاختبارات» وقياسات للعلاقات» كما يمكنه Laf‏ إنشاء جداول أحادية أو 
ثنائية للمتوسطات والانحرافات المعيارية في شكل فئات للمتغيرات الأخرى. 
الأمر العام لإنشاء الجداول “table”‏ هو مقدمة لستة أنواع من الجداول» 
تحتوي خانات هذه الجداول على إحصائيات مثل التكرارات والمجاميع 
والمتوسطات والوسيطء وأخيرا سوف نراجع إجراءات المتغير الواحد» وهي 
تتضمن اختبارات الاعتدال والتحويلات وعرض تحليل البيانات الاستطلاعية 
(EDA)‏ وأغلب التحليلات التي يغطيها هذا الفصلء يمكن القيام بها من خلال 
الأوامر أو من خلال القوائم وذلك باختيار Statistics < Summaries,‏ 
«tables & tests‏ 

بالإضافة إلى هذه التحليلات العامة» يقوم ستاتا بإنشاء العديد من الجداول 
التي لها أهمية خاصة لدى علماء الأوبئة» وقد قام الكاتب Selvin‏ )2004( 
بالتطرئق لهذا الموضوع بالتفصيل. 
أمثلة عن الأوامر : Example Commands‏ 


-Summarize yl y2 y3 
يقوم هذا الأمر بحساب ملخص للإحصائيات (المتوسطات والانحرافات‎ 
المعيارية وأعلى وأقل قيمة وعدد المشاهدات) للمتغيرات المدرجة بالأمر.‎ 
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.summarize yl y2 y3, detial 


يقوم هذا الأمر بإنشاء ملخصات إحصائية أكثر تفصيلاً تتضمن نسباً 
والتفرطح. 


.summarize yl if x1>3 & !missing(x2) 
يقوم بتحديد ملخص لإحصائيات المتغير ر مستخدماً المشاهدات التي‎ 
x2 قيمتها أكبر من 3 للمتغير 1+ والمشاهدات الموجودة (غير المفقودة) للمتغير‎ 
.summarize y1 [fweight = w], detail 
باس تخدام‎ yf يقوم بحساب ملخصات إحصائية أكثر تفصيلاً للمتغير‎ 
w الأوزان التكرارية في المتغير‎ 
.tabstat y1, stats (mean sd skewness kurtosis n) 
يقوم بحساب الإحصائيات التي تم تحديدها بين الأقواس للمتغير 1ر.‎ 
.tabstat yl, stats(min p5 p25 p50 5 max) by(x1) 
25 حساب ملخصات إحصائية محددة (أقل قيمةء المئين 5 والمئين‎ 
x] مستخدما فئات المتغير‎ y] وهكذا) للمتغيرات‎ 
.tabulate x1 
x] يعرض جدولاً للتوزيع التكراري لكل القيم الموجودة للمتغير‎ 
.tabulate x1, sort miss 
يتضمن القيم المفقودة» ويتم‎ x] يعرض جدول توزيع تكراري للمتغير‎ 
ترتيب الصفوف (القيم) من أعلى تكرار إلى أقل تكرار.‎ 
.tabl x1 x2 x3 x4 
يعرض سلسلة من جداول التوزيع التكراري بحيث يتم إنشاء جدول‎ 
تكراري لكل متغير.‎ 
.tabulate x1 x2 
يعرض جدولاً تقاطعياً لمتغيرين؛ بحيث إن المتغير 1× يكون في صفوف‎ 
الجدول» والمتغير 2× يكون في الأعمدة.‎ 


.tabulate x1 x2, chi2 nof column 
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يقوم بإنشاء جدول تقاطعي» وإجراء اختبار بيرسون 27 للاستقلال» 
ولايعرض خلايا التكرارات ولكن يعطي عمودا للنسب في كل خلية. 
.tabulate x1 x2, missing row all‏ 
يقوم بإنشاء جدول تقاطعي يتضمن القيم المفقودة في الجدول وحسابات 
النسب المئوية» كما يحسب كل إحصائيات المتغيرات (بيرسون واحتمال MU‏ 
وقيمة «Cramér’s Vyd SÀ y‏ وقيمة جاما لجودمان وكروس كال Goodman and‏ 
«Kruskal's gamma‏ قيمة (Kendall JJ iS Tb‏ . 
etab2 x1 x2 x4 x4‏ 
يقوم بإنشاء جدول تقاطعي ثنائي للمتغيرات المدرجة بالأمر. 
.tabulate x1, summ(y)‏ 
يقوم الأمر بإنشاء جدول أحادي يعرض المتوسط والانحراف المعياري 
والتكرارات لقيم المتغير «رلكل فئة من فئات المتغير axl‏ 
.tabulate x1 x2, summ(y) means‏ 
يقوم بإنشاء جدول تقاطعي ثنائي يعرض hugi‏ المتغير rie y‏ كل 
مرافق من قيم المتغيرات 1× والمتغير X2‏ 
eby x3, sort: tabulate x1 x2, exact‏ 
يقوم بإنشاء جدول تقاطعي ثلاثي مع جداول فرعية للمتغير 1× (الصف) 
والمتغير 2د (عمود) عند قيمة من قيم المتغير 3+ كما يقوم بحساب اختبار 
الدقة Fisher’s exact Aui‏ لكل جدول فرعي. 
الخیار iby varname, sort‏ يعمل كمقدمة لأغلب أوامر ستاتا عندما يكون 
له معنى» والخيار sort‏ غير ضروري إذا كانت البيانات مرتبة في المتغير 
-varname‏ 
.table y x2 x3, by(x4 x5) contents(freq)‏ 
يقوم بإنشاء جدول تقاطعي خماسي للمتغير y‏ (صف) في المتغير x2‏ 
(عمود) في المتغير 3× (عمود فرعي) في المتغير 4د (صف فرعي 1) في 
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المتغير x5‏ (صف فرعي 2( وجميع الخلايا سوف تحتوي على 
تكن Nu‏ 

.table x1 x2, contents (mean y1 median y2) 

يقوم هذا الأمر بإنشاء جدول تقاطعي ثنائي للمتغير 1× (صف) في 

المتغير 2 (عمود)؛ والخلايا سوف تتضمن المتوسط للمتغير 1ر والوسيط 
للمتغير 2 

.Svy: tab y, percent ci 

يقوم هذا الأمر باستخدام البيانات المرجحة للدراسات الاستقصائية (التي 

تم تحديدها بالأمر e Ui  (svyset‏ جدول ثنائي للنسبة المئوية للمتغير »^—& 

فترة ثقة 695 وللحصول على مزيد من المعلومات عن خيارات جداول 

بيانات الدراسات الاستقصائيةء قم بطباعة الأمر help svy tab‏ كما أن الفصل 

14 سيشرح بيانات الدراسات الاستقصائية وكيفية تحليلها. 

.Svy: tab y x, column percent 

يقوم هذا الأمر باستخدام البيانات المرجحة للدراسة الاستقصائيةء وإنشاء 

جدول ثنائي مع صف للمتغير ر وعمود للمتغير x‏ وعرض ARS‏ اختبار 

الاستقلالية المعدل ?2« وسوف تحتوي الخلايا على نسب مئوية 


5 


مرجحه. 


الملخصات الاحصائية لقاس اطتغيرات : 
Summary Statistics for Measurement Variables‏ 
الملف gaty electricity.dta‏ بيانات ومعلومات عن استهلاك الكهرباء 
في الولايات المتحدة. وتم الحصول على هذه البيانات من مفوضية الطاقة 
بكاليفورنيا (2012). 


.use C:\data\electricity.dta, clear 
.describe 
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Oe mem‏ 


Contains data from C:\data\electricity.dta 
obs: 51 US states 
electricity use 
2010 (CA Energy 


Commission) 
vars: 7 2 Jul 2012 06:11 
size: 1,734 
س‎ aaaea 
storage display value 
variable name type format label variable label 
——— M € —— i à; 
state 56220 %20s State 
stateab str2 598 State 
(abbreviation) 
region4 byte %9.0g reg4 Census Region (4) 
region9 byte 512 . 0 reg9 Census Division 
(9) 
pop long $8.0g Population, 1000s 
electric long %8.0g Electricity use, 
millions of kWh 
elcap int $8.0g Per capita 


electricity use, kWh 
TT eee 


Sorted by: state 


لإيجاد المتوسط والانحراف المعياري للاستخدام الفردي للكهرباء (elcap)‏ 
قم بطباعة الأمر: 


.summarize elcap 


Variable 






Obs Mean Std. Dev. Min Max 





elcap 51 13318.43 4139.328 6721 27457 


الجدول أعلاه يوضح are Laf‏ المشاهدات الموجودة للمتغير» ويعرض 
أعلى قيمة وأقل قيمة» وإذا قمنا بطباعة الأمر summarize‏ بدون إضافة أي 
متغير» فسوف نحصل على المتوسطات والانحرافات المعيارية لكل متغير 
رقمي في البيانات. 

لمشاهدة تفاصيل أكثر عن الملخصات الإحصائية» قم بطباعة الأمر 


-Summarize elcap, detail 
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Per capita electricity use, kwh 


nn Tee 


Percentiles Smallest 

1% 6721 6721 

5% 7434 7363 
10% 8286 7434 Obs 51 
25% 10359 7467 Sum of Wgt. 51. 
50% 13388 Mean 13318.43 
Largest Std. Dev. 4139.328 

758 16127 19477 
90% 17903 19896 Variance 1.71e+07 
95% 19896 21590 Skewness .7643711 
99% 27457 27457 Kurtosis 4.161063 


مخرجات الأمر tsummarize, detail‏ تحتوي على إحصائيات أساسية 
بالإضافة إلى المعلومات التالية: 

المئينات: والملاحظ أن الربيع الأول (النسبة المئوية 25 -10,359) 
والوسيط (النسبة المئوية 50 - 13,388( والربيع الثالث (النسبة المئوية 75 
= 16,117( « وحيث إن العديد من العينات لا لايتم تقسيمها في شكل ربيعات أو 
el jal‏ معياريةء فإن هذه النسب المئوية عبارة عن تقديرات. 


وهناك في الجدول أربع أعلى قيم» وأربع أقل cad‏ حيث يمكن أن تظهر 
القيم المتطرفة ضمن هذه القيم. 

ومجموع الأوزان: الأمر Oo s qa summarize‏ التكرارية أو 
cfweight‏ ولمزيد من الشرح قم بطباعة الأمر -help weight‏ 

التباين: مربع الانحراف المعياري (الاحتمال الأكثر هو أن الانحراف 
المعياري يساوي الجذر التربيعي للتباين). 


الالتواء: وهو اتجاه ودرجة عدم التماثل في منحنى التوزيع الطبيعيء 
فالتوزيع الطبيعي المتمائل Lalas‏ هو التوزيع الذي يكون فيه الالتواء يساوي 
صفراء أما الالتواء الموجب (ذيل المنحنى أطول في الجانب الأيمن) يعني أن 
الالتواء أكبر من الصفرء أما الالتواء السالب (ذيل المنحنى أطول في calal‏ 
(ul!‏ يعني أن الالتواء أصغر من الصفر. 
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التفرطح: وزن ذيل المنحنى» التوزيع الطبيعي (منحنى جاوس) يكون 
متماثلاً Laie‏ يكون التفرطح يساوي 3» Ul‏ إذا كان منحنى التوزيع أطول من 
الطبيعي» (مدبب بشكل كبير) فإن التفرطح أكبر من 3 أما إذا كان التفرطح 
أقل من 3 فإن هذا يشير إلى ذيل أقل من الطبيعي. 

الأمر ttabstat‏ يعتبر ENT‏ أكثر مرونة للأمر Cus summarize‏ يمكننا 
تحديد الإحصائيات التي نريد حسابهاء فمثلاً 


.tabstat elcap, stats(mean min max) 





variable mean min max 


elcap 13318.43 6721 27457 


باستخدام الأمر tabstat‏ مع الخيار by(varname)‏ يمكننا إنشاء جدول 
يحتوي على الملخصات الإحصائية لكل قيمة من قيم cvarmame‏ المثال أدناه 
يقوم بإنشاء جدول للمتوسطء وأعلى وأقل قيمة لاستخدام للفرد الواحد 
للكهرباء بشكل منفصل لكل إقليم من الأقاليم الأمريكية الأربعة في التعداد 
السكاني» حيث إن استخدام الكهرباء يُعتبر Lond‏ في الشمال الشرقي 
Northeast‏ ومر bä‏ في الجنوب South‏ والنصف الغربي -Midwest‏ 


.tabstat elcap, stats (mean min max) by (region4) 


Summary for variables: elcap 
by categories of: region4 (Census Region (4)) 









region4 mean min max 





Northeast 
Midwest 
South 
West 


8746 
115 10516 19477 
16001.06 11343 21590 
12206.92 








13318.43 
بالإضافة إلى المتوسط mean‏ وأقل قيمة (lel 5 min‏ قيمة «max‏ هناك 

إحصائيات أخرى متوافرة مع الخيار stats()‏ والأمر tabstat‏ تتضمن 
المجموعة التي سبق استخدامها سابقا مع الأمر collapse‏ والأمر graph bar‏ 
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(مثل count, sum, max, min, variance, sd,‏ و المئينات من cae pi‏ ووم) 
وهناك خيارات إضافية أخرى يمكن من خلالها التحكم في شكل الجداول 
وتوصيفاتها. وللحصول على قائمة كاملة بهذه الخيارات» قم بطباعة الأمر 
«help tabstat‏ 

الإحصائيات التي تم إنشاؤها بواسطة الأمر «ummarize‏ أو الأمر 
4 تقوم بشرح وصفي للعينة» وخدمة لبعض الأغراض الأخرىء فإننا 
قد نقوم بتحديد فترة ثقة للاستدلال عن المجتمعات الكبيرة» وكما تم شرحه 
سابقاء فإنه يمكننا الحصول على فترة ثقة %99 لمتوسط المتغير elcap‏ 

.ci elcap, level(99) 
Variable Obs Mean Std. Err. [99$ Conf. Interval] 
elcap 51 13318.43 579.6218 11766.32 14870.54 

في بيانات العينة الموجودة لديناء فإنه يمكننا التأكد بنسبة 9699 أن 
متوسط المجتمع يكون في فترة الثقة إذا كانت قيمته بين 11,766 إلى 
60 كيلووات في الساعة للفرد الواحدء وبشكل أكثر دقة فإنه فى العديد 
من العينات العشوائيةء فترات الثقة التي يتم إنشاؤها بهذه الطريقة يجب أن 
يكون متوسط مجتمعها نحو %95 عند اختيار العينة» فالخيار level(99)‏ يحدد 
أن فترة الثقة تساوي .9699( وإذا قمنا بإهمال هذا الخيارء فإن الوضع 
الافتراضي للأمر ci‏ هو اختيار 9695 كفترة ثقة. 

الخيارات الأخرى تسمح للأمر ei‏ بحساب فترة ثقة محددة للمتغيرات 
التي تتبع توزيع ذي الحدين أو توزيع بواسونء والأمر المتعلق بهذه 
الحسابات هو cii‏ الذي يقوم بحساب فترات الثقة مباشرة للتوزيع الطبيعي 
وتوزيع ذي الحدين وتوزيع بواسون وذلك من الملخصات الإحصائية. 
وللحصول على تفاصيل عن هذه الأوامر» قم بطباعة الأمر help ci‏ 
dls‏ البيانات الاستكشاق : Exploratory Data Analysis‏ 


الإحصائي Joh Tukey‏ جمع مجموعة من الأدوات للطرق الحديثة والقديمة 
لتحليل البيانات الاستكشافي. وهي تتضمن تحليل البيانات بطريقة استكشافية بدون 
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إجراء أي افتراضات غير ضرورية Tukey; Mosteller and Tukey hi)‏ 1977 
3 ,1985) فرسومات الصندوق التي تم شرحها في الفصل (3) تعتبر أكثر 
الأشكال البيانية استعمالاً في تحليل البيانات الاستكشافي» وهناك طريقة أخرى 
وهي عرض الساق والورقة» وهي طريقة جغرافية لترتيب قيم البيانات» بحيث إن 

الأرقام الأولية تعتبر هي الساق» وباقي الأرقام لكل مشاهدة تعتبر الأوراق. 
.Stem elcap‏ 


Stem-and-leaf plot for elcap (Per capita electricity use, kWh) 


bf 721 
ete 363,434,467,952 
quie 286,514,591,696,982,985 
9r 
LOSES 106,359,516,739 
qp 253,343,395,759 
l2*** 077,159,379,497,845,904 
qt 388,557,916,992 
LARS 179, 263,325,345,475,489,578 
15 28% 048,568 
TENRA 117,293,315, 519,793 
Lae 290,293,903 
Leen 852 
+ نقد‎ 477,896 
20*** 
P V eda 590 
22*** 
23*** 
24*** 
25x** 
26*** 
1 ariaa 457 


في هذا العرض» أقل قيمة لاستهلاك الكهرباء للفرد الواحد هي 6,721 
(كاليفورنيا) حيث تظهر قيمة 721 كورقة للساق ***6» وأعلى قيمة 
7 (ويمينج) تظهر كورقة 457 للساق ***27» فالأمر stem‏ يقوم 
تلقائيا باختيار القيم للساق» ويمكنه تجاوز هذا باستخدام الخيار ine)‏ ولمزيد 
من المعلومات حول هذا الخيار قم بطباعة الأمر shelp stem‏ 

الأمر 1۷ : يستخدم إحصائيات مرتبة لشرح التوزيع. 

.lv elcap 
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# 51 Per capita electricity use, kWh 
M 26 | 13388 Spread pseudosigma 
F 13.5 10437.5 13140 15842.5 5405 4131.039 
E T 8514 12903.5 17293 8779 3894.835 
D 4 7467 13472 19477 12010 4098.322 
c 235 7398.5 14070.75 20743 13344.5 3866.579 
B 145 7042 15782.75 24523.5 17481.5 4369.45 
$ 6721 17089 27457 20736 4689.655 
# below # above 
inner fence 2330 23950 0 T 
outer fence SFIS 32057.5 0 0 


في الجدول M odef‏ يشير إلى الوسيطه ۴ الربيعات (الربيعات 
باستخدام تقدير مختلف عن تقدير الربيعات الذي تم استخدامه في الأوامر 
(summarize, detail, tabsum‏ أما 8» ط» © ... تشير إلى النقاط الفاصلة مثل 
8/1« 16/1 32/1 ... للتوزيع المتبقي خارج منطقة ذيل منحنى التوزيع» 
الأرقام بالعمود الثاني توضح المسافة أو العمق من أقرب نهاية لكل قيمة 
حرفية» Ld‏ الجزء الأوسط في الجدول فهو يتضمن ADE‏ أعمدة العمود 
الأوسط يوضح متوسطات قمتين حرفيتين» إذا انتقلت هذه القيم بعيداً عن 
الوسيط كما حدث في المتغير elap‏ فإن هذا يعني أن التوزيع أصبح ذا التواء 
مرتفع» وأصبح يتجه أكثر نحو ذيل منحنى التوزيع» ويكون التشتت مختلفاً 
بين نوعين من القيم الحرفية. فمثلاً التشتت بين قيم ۴ يساوي تقريباً المدى 
بين الربيعات؛ وأخيرا العمود الأخير gi‏ الجانب الأيمن P pseudosigma‏ 
بتقدير الانحراف المعياري الذي من المفترض إذا كانت القيم الحرفية تشر 
مجتمع جاوس» eS‏ ۴ في العمود الأخير pseudosigma‏ في الجانب "ar‏ 
أحياناً يطلق عليها الانحراف المعياري الوهمي (PSD)‏ وهو يفحص عينة ما 
وقيمها المتطرفة لتقدير طبيعة التوزيعات المتماثلة: 


1- مقارنة المتوسط مع الوسيط لفحص الالتواء بشكل كلي: 
المتوسط > الوسيط التواء موجب 
laua gll = daas gall‏ متمائل 
المتوسظ gl gil bads‏ سافب 
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2- إذا كان المتوسط والوسيط متشابهين» فهذا يشير إلى أن التوزيع متماثل. 
لذا فإن المقارنة بين الانحراف لمعياري والانحراف المعياري الوهمي 
(PSD)‏ تساعد في تقييم طبيعة ذيل منحنى التوزيع الطبيعي: 
التوزيع الطبيعي <PSD‏ ذيل منحنى التوزيع أكبر من الطبيعي 
التوزيع الطبيعي = PSD‏ ذيل منحنى التوزيع طبيعي 
التوزيع الطبيعي >PSD‏ ذيل منحنى التوزيع dil‏ من الطبيعي 
لنفرض أن Fr‏ وو تشيران إلى الربع والثلاثة أرباع (تقريباً الربيع 

الأول والربيع الرابع) فإن المدى الربيعي IOR‏ يساوي Fy‏ ناقصاً ۴ء 

والانحراف المعياري الوهمي PSD‏ يساوي JOR‏ مقسوماً على 1.349. 

bad dag ty dl‏ القيم المتطرفة تطرفاً حاداً وتطرفاً بسيطاً (هناك 
قيمة واحدة ة متطرفة تطرفاً بسيطأ في توزيع المتغير (elcap‏ يمكننا أن نسمى 
القيمة x‏ 'قيمة متطرفة تطرفاً بسيطاً" عندما تبرز خارج الحد الداخلي وليس 
الحد الخارجي: 

F; L5IQR«x > F; + 3IQR jF- 3IQR <x <F; 1.SIQR 

القيمة #اقيمة متطرفة تطرفاً "ats,‏ عندما تبرز خارج الحد الخارجي: 

P»FRGIQR gl X<F,-3I0R 

الأمر ۷[ يوضح هذه الحدود؛ كما alae] gaa‏ القيم المتطرفة لكل نوع» 
القيم المقطرفة fala là jl‏ وهي القيم التي تقع خارج الحدود الخارجية وهي 
نادرة الحدوث (نحو 2 لكل مليون) في المجتمعات الطبيعية» تطبيقات محاكاة 
مونت كارلو تشير إلى أن وجود أي قيمة متطرفة في العينات التي حجمها n‏ 
150 إلى 20,000 = n‏ يفترض أن يكون {als Sula‏ لرفض فرضية E‏ 
normality hypothesis‏ عند -a = 0.05(Hamilton 1992b)‏ 

الأوامر summarize, stem, Iv‏ جميعها تؤكد أن توزيع العينة للمتغير 
elcap‏ له التواء موجب» ولا Andy‏ منحنى التوزيع الطبيعي النظري. الجزء 
التالي من هذا الفصل»ء سوف يشرح اختبارات الاعتدال بشكل أكثر تفصيلا 

والتحويلات التي يمكن أن تقلل من التواء المتغيرات. 
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: الاعندال والتحويلات‎ olus 


Normality Tests and Transformations 


العديد من الاختبارات الإحصائية تكون ذات كفاءة عندما يتم تطبيقها 
على متغيرات نت تتبع التوزيع الطبيعي. الجزء التالي سيشرح طرق استكشاف 
لفحص الاعتدال التقريبي» واستخدام أدوات الرسم البياني (المدرج التكراري» 
ورسم الصندوق» وشكل «Lal‏ وأشكال الربيعات) التي تم شرحها في 
الفصل .3( واختبارات الالتواء والتفرطح موضحا لإحصائيات الالتواء 
والتفرطح عند استخدام الأوامر summarize, detail‏ التي يمكنها تقييم فرضية 

العدم وهي أن العينة تم الحصول lele‏ من مجتمع موزع توزيعاً طبيعياً. 
.Sktest elcap‏ 


Skewness/Kurtosis tests for Normality 





joint 
Variable Obs Pr (Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 


elcap 51 0.0223 0.0723 7.49 0.0236 


الأمر sktest‏ يرفض الاعتدال: المتغير elap‏ يظهر غير طبيعي بشكل 
ملحوظ Gus‏ إن الالتواء (p=0.0223)‏ بالرغم من أن التفرطح )0.723 = (p‏ 
وكلتا الإحصائيتين (الالتواء والتفرطح) (p = 0.0236) las‏ 

اختبارات ase yl‏ الأخرئ تتضمن. طرق Giles!‏ الحصائية # لشابيزو 
ويلك Shapiro-Wilk W(swilk)‏ وإحصائية 7 لشابيرو فرانسيا Shapiro-‏ 
Francia(sfrancia)‏ (لمزيد من المعلومات قم بطباعة الأمر «(help sktest‏ 
نموذج ستاتا لحساب اختبارات حلقات دورنيك هانسن Doornik-Hansen‏ 
للاعتدال الأحادي والمتعدد متوافرة على الإنترنت (قم بطباعة الأمر findit‏ 
-(omninorm‏ 

التحويلاث اللاخطيّة مثل الجذور التربيعية واللوغاريتمات يتم استخدامها 
عادة لتغيير أشكال carp sill‏ وذلك بهدف جعل التواء التوزيعات أكثر BLS‏ 
وأقرب للتوزيع الطبيعي. التحويلات قد تساعد في جعل العلاقة بين 
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المتغيرات علاقة خطيّة (الفصلان 7 و8. الجدول )5 .1( يعرض تعاقباً يىمى 
Tukey) cs sill lus‏ 1977( وهو يوضح Sula‏ لاختيار التحويلات التي تقوم 
بتغيير شكل التوزيعات» المتغير elcap‏ يعرض التواء esas liis‏ لذا فإن 
جذره التربيعي قد يكون متماثلاًء ويمكننا إنشاء متغير ane‏ يساوي الجذر 
التربيعي للمتغير leap‏ وذلك بطباعة الأمر التالي: 
.generate srelcap = elcap ^.5‏ 
Ya 15‏ من كتابة 5.^ elcap‏ يمكننا كتابة -sqrt(elcap)‏ 
اللوغاريتمات هي عبارة عن تحويل آخر يمكنه تخفيض الالتواء 
الموجب» ولإنشاء متغير جديد(مهءاءج:) يساوي اللوغاريتم الطبيعي للمتغير 
elcap‏ يمكننا طباعة الأمر: 
-generate logelcap = 1n(elcap)‏ 
في سلم القوى وطرق التحويل ذات الصلة مشل بوكس-كوكس 
واللوغاريتمات فهي تأخذ مكان قوة 0 وهذه الطرق لها تأثير متوسط على 
شكل التوزيع» وهذا التأثير يتراوح ما بين 0.5 (الجذر التربيعي) و0.5- 
(عكس الجذر التربيعي) للتحويلات. 
جدول (1.5): سلم القوى 


المكعب new = old^3‏ | تخفيض الالتواء السالب الحاد 
التربيع 2 ح new‏ | تخفيض الالتواء السالب البسيط 
بيانات خام 4 | لا يوجد تغيير (بيانات خام) 
الجذر التربيعي 5 = new‏ | تخفيض الالتواء الموجب البسيط 


اللوغاريت - 

ا و2 | تخفيض الالتواء الموجب 
سالب عكس الجذر التربيعي | new =-(0ld5)‏ | تخفيض الالتواء الموجب الحاد 
المتبادلة السالبة new = - (old^-1)‏ | تخفيض الالتواء الموجب A‏ 
مربع المتبادلة السالبة new =- (old^-2)‏ | تخفيض الالتواء cas gall‏ الحاد 
مكعب المتبادلة السالبة new =- (old^-3)‏ | تخفيض الالتواء cas. gall‏ الحاد 
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قمنا بأخذ القيم السالبة للنتيجة بعد رفع الأس لأقل من صفر. وللحفاظ 
على الترتيب الأصلي للبيانات» فإن أعلى قيمة في المتغير القديم old‏ سوف 
يتم تحويلها إلى أعلى قيمة في المتغير الجديد y new‏ وهكذاء وعند احتواء 
المتغير old‏ على قيمة سالبة أو صفرء فإنه من الضروري إضافة ثابت قبل 
إجراء عملية التحويل» Wiad‏ إذا كان المتغير arrests‏ يقوم بقياس axe.‏ المرات 
التي تم فيها اعتقال شخص ما (وهناك قيمة صفر للعديد من الأشخاص) فإنه 
من الأفضل استخدام اللوغاريتم لإجراء التحويل. 
.generate logarrest - ln(arrests + 1)‏ 
الأمر ladder‏ : يجمع alu‏ القوى مع الأمر sktest‏ للاعتدال» وهو يحاول 
استخدام كل قوة في السلم» ويفصح عما إذا كانت النتيجة غير طبيعية بشكل 
كبير. يمكن توضيح ذلك باستخدام الالتواء الموجب في المتغير celcap‏ والذي 
يحتوي على بيانات استهلاك الكهرباء لكل فرد بملف البيانات electricity.dta‏ 
.ladder elcap‏ 





Transformation formula chi2(2) P(chi2) 
cubic elcap^3 44.12 0.000 
square elcap^2 26.24 0.000 
identity elcap 7.49 0.024 
square root sqrt (elcap) 1.21 0.547 
log log(elcap) 0.26 0.879 
1/(square root) 1/sqrt(elcap) 2.36 0.307 
inverse 1/elcap 4.87 0.088 
1/square 1/(elcap^2) 10.67 0.005 
1/cubic 1/(elcap^3) 17.51 0.000 


pas اويا‎ pate, aust ind gutes qai. Ji 
تقوم بتقريب التوزيعات التي لا تختلف بشكل كبير عن التوزيع الطبيعي. في‎ 
هذا الصددء فإن التحويلات هي عبارة عن تطويرات تتم إضافتها على‎ 
من‎ -(p=0.024) regio exl ae التي تختلف‎ P. البيانات‎ 
(1.5) الواضح أن أللوغاريتمات تعتبر أفضل خيار للتحويل الطبيعي؛ الشكل‎ 
«A s ill oA gl id Led والذي تم إنشاؤه بواسطة الأمر 6 يعطي‎ 
وذلك من خلال مقارنة المدرجات التكرارية لكل عملية تحويل إلى منحنى‎ 
التوزيع الطبيعي.‎ 


.gladder elcap 
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SS > 2 ape. teeny‏ 


cubic identity 


%4 


0 5.00e+1D0e+150e+2D0e+13 0 2.00e:800e 6800608006 40; 5000 1000015000200002500030000 


Square 


S06.08380850-13 
Q.0&.089.0909.-09 
P 

204-0E0E0E0504 


sqrt log 1/sqrt 
S nid S 
> 8 و‎ a 
= 
a E ( ^ 8 
c ag 8 
a: T NM 8 LX 
a = 
3 3 = > E 
80 100 120 140 160 85 9 95 10 105 -012  -01  -008 -.006 
x inverse 8 1/square a 4/cubic 
e + * 
i $ à 
* ¥ 
$ 8 8 
¥ ¥ 
8 Bs 3 3 
AD م‎ E 
eo o e 
-.000:180012000:0000800000004 -2.00e-050e-000e-600e-09 0 -3.00e-122.00e-121.00e-12 0 


Per capita electricity use, kWh 
Histograms by transformation 


الشكل )1.5( 


الشكل )2.5( يعرض مجموعة متقابلة من الرسومات البيانية لتحويلات 
lw‏ القوى. تم إنشاء هذه الأشكال بواسطة أمر سلم الربيعات „gladder‏ 
(لمزيد من cL gleall‏ عن ladder, gladder, gladder‏ قم بطباعة 
ر NN «(help ladder‏ وما ODE ERN‏ وضيوحاً في 
المثال olif‏ يمكننا جعل قياس التوصيفات والرموز في الرسم تظهر بحجم 
نسبته 9625 من حجمها الأصلي» el B,‏ عن طريق استخدام الخيار 
scale(1.25)‏ وتوصيفات المحاور (والتي قد يصعب قراءتها نظراً لتزاحمها) 
e‏ إخفاؤها عن طريق استخدام الخيار ylabel(none) xlabel(none)‏ 


qladder elcap, scale(1.25) ylabel(none) 
xlabel (none) 
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cubic square identity 
e e © 
P d 
1/square 1/cubic 


inverse 


Per capita electricity use, kWh 


Quantile-Normal plots by transformation 


الشكل )2.5( 


هناك طريقة Alay‏ للتحويل يطلق عليها بوكس — كوكس ‘Box-Cox‏ وهي 
تؤفر اقذرجا أفضل بين التحر CDG‏ وآلية الاختيار فيما بين هذه المتغيرات 
(وهي سهلة للمحلل» ولكنها ليس دائماً الطريقة الأفضل)» الأمر beskewO‏ 
وجد Gh‏ قيمة ۸ (لمدا) للتحويلات 


$ 


أو: 
A=0‏ مسا = yO‏ 
القيمة متل WO‏ في العادة لها قيمة التواؤها يساوي صفرا تقريباًء 
وبتطبيق ذلك على المتغير elap‏ يمكننا الحصول على متغير جديد يكو 
اسمه belcap‏ وذلك عن طريق طباعة الأمر التالي: 
level(95)‏ 


Interval] 


- elcap, 


[95$ Conf. 


Skewness 


.bcskew0 belcap 


L 


Transform 
3.75e-06 





.1451061 -.8268476 .8784035 


(elcap^L-1)/L 
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الفضل الشافن ‏ لے رت 


المعادلة (1(/)0.145 belcap=(elcap™!-‏ تقوم بالتحويل لجعل التوزيع 
أكثر تماثلاً ومقترباً من إحصائية الالتواء المطلوبة» بارامتر بوكس - 
كوكس 0.145 = X‏ ليس من خيارات سلم القوى واللوغاريتم (الذي كان 
مرفوعاً للأس 0(« وكانت فترة الثقة ل ۸ تتضمن 0 (لوغاريتم) ولكن لا 


تتضمن 1 (لا تغيير): 
0.827«3.«0.878- 
الفصل )8( يشرح طريقة كوكس - بوكس لنموذج الانحدار بطريقة 
أكثر تفصيلا. 


الجداول النكرارية.. والجداول النقاطعية الثنائية : 


Frequency Tables and Two-Way Cross-Tabulations 





الملخصات الإحصائيةء والرسومات البيانية» والتحويلات التي سبق 
شرحها يمكن تطبيقها بشكل ا ا القابلة للقياس. Lod‏ 
المتغيرات الطبقية فتتطلب á yb‏ أخرى في العادة تبدأ باستخدام جداول أحادية 
3 ثنائية. وبالعودة إلى بيانات مركز جر انيت. بالملف Granite2011 6.dta‏ 
هناك سوال (rackus)‏ عن ماذا كان الناس يعتقدون أن الولايات المتحدة تسير 
في الاتجاه الصحيح» أو أنها في الاتجاه الخطأ؟ بالرغم من أن هذا السؤال 
يبدو غامضاء وتمت صياغته بطريقة غريبة» ولكنه سؤال تقليدي يُستخدم في 
استطلاعات الرأي بالولايات المتحدة لقياس المزاج العام للمواطنين» أغلبية 

المواطنين بولاية نيوهامبشير أظهروا تشاؤمهم عن وضع البلاد. 
.tabulate trackus‏ 


US right 

direction or 
wrong track Freq. Percent Cum. 
Right direction 176 37.29 37.29 
Wrong track 296 62.71 100.00 





Total 472 100.00 
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الأمر tabulate‏ : يمكنه إنشاء جداول تكرارية للمتغيرات التي تحتوي 
على آلاف القيم. وقبل إنشاء جداول توزيع تكراري لمتغير معين يحتوي 
على العديد من القيم» فإننا نحتاج إلى تصنيف هذه القيم باستخدام الأمر 
generate‏ مع الخيار recode‏ والخيار autocode‏ (لمزي يد من المعلومات عن 
الأمر generate‏ انظر الفصل 2 أو قم بطباعة الأمر (help generate‏ . 


نقوم باستخدام الأمر tabulate‏ يليه أسماء متغيرين اثنين لإنشاء جدول 
تقاطعي . Sad‏ لإنشاء جدول تقاطعي للمتغير trackus‏ مع المتغير educ‏ 

(مستوى التعليم لدى المشاركين بالدراسة) نقوم بطباعة الأمر: 
.tabulate eductrackus‏ 


US right direction or 
wrong track 
Right dir Wrong tra 






Highest degree 
completed 












HS or less 
Tech/some coll 

College grad 
Postgrad 


اسم المتغير الأول سوف يمثل الصفوف» والمتغير الثاني يمثل الأعمدة 
في الجدول» من الجدول أعلاه يمكننا أن نرى أن 71 من 107 مشارك في 
الدراسة مستواهم التعليمي الثانوية العامة أو أقل HS or less‏ يعتقدون بأن 
الولايات المتحدة تسير في الاتجاه الخطأ. 

ولكن السؤال: هل وجهات النظر مم لها علاقة بالمستوى التعليمي؟ 
وللإجابة عن ذلك» يمكننا إجراء اختبار كاي تربيع ox?‏ واختبار نسب 
الصف لأن المتغير educ‏ والذي يظهر في صفوف الجدول - يمثل المتغير 
المستقل في هذا الاختبارء الخيار row‏ يحدد النسب المئوية للصفوف» والخيار 
nof‏ يعني عدم إظهار التكرارات. 


.tabulate educ trackus, row nof chi2 
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Lie‏ اللو وف 6٠‏ لور ج ي 













US right direction or 
wrong track 
Right dir Wrong tra 


Highest degree 
completed 


HS or less 
Tech/some coll 

Coliege grad 
Postgrad 


100.00 
100.00 
100. 


Pearson chi2(3) - 12.7549 Pr - 0.005 


نحو %69 من المشاركين في Aud pall‏ لديهم مؤهل علمي تقني أو كلية 
Tech/some coll‏ يعتقدون a‏ الولايات المتحدة في الاتجاه الخطأء ولكن Ales‏ 
الشهادات العليا postgrad‏ يبدو أنهم أكثر تفاؤلاً حيث إن نسبة %48 منهم 
يعتقدون نفس الاعتقاد. وبناءً على هذه العينة يمكننا أن نرفض فرضية العدم» 
وهي عدم وجود علاقة بين المتغير educ‏ والمتغير trackus‏ في مجتمع 
الدراسة بولاية هامبشير )0.005 -م,23-12.75). 

الأمر tabulate‏ به العديد من الخيارات امفيدة التي تساعد في إنشاء 
الجداول الثنائية. هذه الخيارات تتضمن اختبارات Alas‏ (اختبار الدقة لفيشر» 
معدل الإمكان 77(« ومقاييس العلاقات (قيمة جاما لجودمان وكروسكال ‏ » 
وكندال تاو أ c Ta‏ ومعامل ارتباط كريمر 7(« الخيار missing‏ يحدد بأن القيم 
المفقودة يجب تضمينها في صفوف أو أعمدة الجدول» الأمر tabulate‏ يمكنه 
حفظ التكرارات» وأسماء المتغيرات كمصفوفة» لمزيد من المعلومات عن هذه 
الخيارات قم بطباعة الأمر -help tabulate‏ 

أحياناً قد نحتاج إلى إعادة تحليل الجداول المنشورة بدون الرجوع إلى 
البيانات الأصلية. هناك أمر خاص وهو tabi‏ (الجدول الفوري) يقوم بهذه 
المهمة. قم بطباعة تكرارات الخلايا في سطر الأمر مع فصل صفوف 
الجدول بعلامة ١”‏ “» لشرح كيفية قيام الأمر tabi‏ بإعادة إنشاء الجدول 
التقاطعي ما قبل السابق مباشرة من تكرارات الخلايا بدون الرجوع إلى أي 
بيانات: 
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.tabi 36 71 ١ 34 76 ١ 49 93 ١ 56 52 





467 
Pearson chi2(3) = 12.7549 Pr - 0.005‏ 
وللقيام بنفس التحليل» 9 © U2‏ النسب المئوية للصفوف» واختبار كاي 


y“ تربيع‎ 
.tabi 36 71 ١ 34 76 ١ 49 93 ١ 56 52, row nof chi2 





100.00 
Pearson chi2(3) = 12.7549 Pr = 0.005‏ 
الأمر tabi‏ : يختلف عن الأمر tabulate‏ في أنه لا يتطلب وجود أي 


بيانات في ذاكرة برنامج Giu‏ وعند إضافة الخيار replace‏ يمكننا جعل 
الأمر tabi‏ يقوم باستبدال أي بيانات في الذاكرة بالبيانات الجديدة التي تظهر 
في الجدول التقاطعي؛ الخيارات الإحصائية ..-chi2, exact, nofreq)‏ الخ) 
تقوم بنفس المهام مع الأمر tabi‏ التي قامت بها من قبل مع الأمر tabulate‏ 
ولمزيد من المعلومات قم بطباعة الأمر -help tabulate twoway‏ 

حتى الآن كل الأمثلة التي تم شرحها في هذا الجزءء لا تتضمن أوزاناً 
Aaa ye‏ وكما تم شرحه سابقا في الفصل )4( فإن الباحثين في الدراسات 
الاستقصائية في العادة يطبّقون الأوزان المرجحة بعناية فائقة» وذلك لجعل 
نتائج العينة ممثلة للمجتمع المسستهدف» المتغير censuswt‏ يمشل الأوزان 
المرجحة لبيانات استطلاع الرأي التي جمعها مركز جرانيت» وتم اس تخدام 
الأمر svyset‏ للتأكيد ob‏ هذه الأوزان هي أوزان احتمالية. 


الفصل الخامس : الملخصات الإحصائية والجداول 231 





.Svyset [pw = censuswt] 


الأوامر التي تبدأ ب : vy‏ سوف تقوم بتطبيق الأوزان الاحتمالية svyset‏ 

بشكل تلقائي» أما بالنسبة للأوامر الأخرىء فإنها تتجاهل الأوزان» وسوف 
نسرد بعض الأمثلة عن الأوزان الاحتمالية في الجداول الثنائية. 

.Svy: tab trackus 

(running tabulate on estimation sample) 














Number of strata = 1 Number of obs = 472 
Number of PSUs = 472 Population size = 474.80568 
Design df = 471 
US right 
direction 
or wrong 
track proportions 
Right di 
Wrong tr .6304 
Total 
Key: proportions - cell proportions 
.Svy: tab eductrackus, row percent 
(running tabulate on estimation sample) 
Number of strata  - + Number of obs = 467 
Number of PSUs = 467 Population size = 469.25491 
Design df = 466 











direction or wrong 
track 
Right di Wrong tr Total 


Highest US right 
degree 


completed 






HS or le 


Tech/som 24.5 75.5 i00 
College 36.41 63.59 100 
Postgrad 53.41 46.59 100 

Total 37.26 62.74 100 


Key: row percentages 


Pearson: 
Uncorrected | chi2(3) = 21.3629 
Design-based F(2.99, 1394.32)= 5.9918 P = 0.0005 
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في الجدول الذي يعرض الأوزان المرجحة:» يمكننا أن نرى الفرق الكبير 
في التشاؤم بين المشاركين في الدراسة وبين الذين يحملون مؤهل المعهد 
التقني أو لم يُكملوا الجامعة Tech/some‏ )7675.5 يعتقدون أن الولايات 
المتحدة في الاتجاه الخطأ) والذين يحملون مؤهلات دراسات عليا )2646.6 
يعتقدون أن الولايات المتحدة في الاتجاه الخطأ)» التصميم بناءً على اختبار F‏ 
يعطي نتائج مناظرة للجدول المرجح لاختبار كاي تربيع. اختبار F‏ يؤكد أن 
العلاقة بين المتغير educ‏ والمتغير frackus‏ هي علاقة إحصائية ذات معنوية 
-(p = 0.005):‏ 
الجداول اطتعددة.. والجداول اللقاطعية اطلعرده : 
Multiple Tables and Multi-Way Cross-Tabulations‏ 
عند العمل مع الدراسات الاستقصائية والبيانات الكبيرة» فإننا أحياناً 
نحتاج إلى التوزيعات التكرارية للعديد من المتغيرات المختلفة. وبدلا من 
إنشاء كل جدول بشكل منفصل في كل مرة» يمكننا استخدام أمر آخر خاص 
وهو «tabl‏ 
.tab1 tparty Obama trackus‏ 
ولإنشاء جداول تكرارية أحادية لكل متغير من s warty‏ وحتى المتغير 
wrackus‏ في هذه البيانات (في المرة الواحدة يمكنك استخدام 30 متغيراً كحد 
أقصى) قم بطباعة الأمر 
.tabl tparty- obama‏ 
وبالمثل» فإن الأمر tab?‏ يقوم بإنشاء جداول ثنائيةء فمثلاً الأمر التالي 
يقوم بإنشاء جداول تقاطعية ثنائية لكل متغير 
.tab2 tparty obama trackus‏ 
والأمر tabl‏ والأمر tab2‏ يستخدمان الخيارات التي يستخدمها الخيار 
«tabulate‏ 
ولإنشاء جداول احتمالية متعددةء فإنه من الممكن استخدام الأمر 
tabulate‏ مع وضع المحدد by‏ قبل الأمر. فعلى سبيل المثال» لإنشاء جدول 
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تقاطعي أحادي عن المشاركين الذين قاموا بانتخاب الرئيس أوباما في سنة 
8 وعما إذا كان خريجو كليات أو لاء نقوم بطباعة الأمر التالي: 
.tab obama college. col nof chi‏ 










Voted for 
Obama in College graduate 
2008 Non colle College 





Total 






+ tT 
100.00 100.00 100.00 


Pearson chi2(1) = 20.2966 Pr = 0.000 

وهناك طريقة واحدة لإنشاء جدول تقاطعي ثلاشي لل تغير «Obama,‏ 
والمتغير college‏ وعلاقتهما بمتغير الجنس csex‏ وذلك باستخدام الأمر sort‏ 
والمُحدد Cus cby‏ يقوم هذا المحدد بإنشاء جداول تنائية بنفس تنسيق الجداول 
أعلاه» ولكن بشكل منفصل للذكور والإناث. 


“sort sex 
-by sex: tab obama college, col nof chi 





-» sex - Male 


Voted for 
Obama in College graduate 
2008 Non colle College Total 





Pearson chi2(1) - 14.5888 Pr - 0.000 


-» sex = Female 


Voted for 
Obama in College graduate 
2008 Non colle College Total 





Pearson chi2(1) - 7.2227 Pr - 0.007 
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العلاقة بين المتغيرين college s Obama‏ ذات معنوية» وفي نفس الاتجاه 
للجدولين cel‏ ولكن يظهر أن العلاقة أكثر قوة بين الرجال (حيث إن نسبة 
خريجي الجامعة تمثل 25 نقطة 9 إلى %55.12( عن النساء )16 
Aba‏ فرق» 45.38 إلى %61.79( 

هذه الطريقة يمكن استخدامها لإنشاء جداول أكثر تعقيداًء فمثلاً لإنشاء 
جدول تقاطعي رباعي للمتغير obama‏ مع المتغير college‏ مع جداول فرعية 
للرجال والنساء المتزوجين وغير المتزوجين» يمكننا طباعة الأمر التالي a)‏ 


يتم عرض نتائج هذا الا مر): 


.sort sex married 
.by sex married: tab Obama college, col nof chi 


مثل هذا الجدول المتعدد يصنف البيانات في عينات فرعية يكون فيها 
التباين ASÍ‏ قوة. 

هناك طريقة أخرى لإنشاء الجداول المتعددة» فإذا كنا لا نحتاج إلى 
النسب المئوية أو الاختبار ات الإحصائية؛ فإنه يمكننا استخدام الأمر العام 
لإنشاء الجداول وهو table‏ فهذا الأمر له عدة مزايا وعدة خيارات» تم 
عرض جزء بسيط منها فقط» ولإنشاء جدول ثنائي للمتغير obama‏ مع 
المتغير eee college‏ تكرارات في كل خلية نقوم بطباعة الأمر التالي: 


.table obama college, contents(freq) 







College graduate 
Non college College 


إذا قمنا بتحديد متغير طبقي ثالث» فسوف يتم إنشاء أعمدة فرعية في 
جدول ثلاثي كما يلي: 


.table obama college sex, contents(freq) 
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Gender and College graduate 
Male —————— —————— Female 
Non college College Non college College 


Obama in 
2008 





الجداول الأكثر تعقيداً تتطلب استخدام الخيار )برط والذي يمكنه استخدام 
أربعة متغيرات فرعية أخرىء لذا فإن الأمر table‏ يمكنه إنشاء جدول لسبعة 
متغيرات (عمود daly‏ وصف واحد وعمود فرعي واحد وأربعة صفوف 
فرعية) ويتم إنشاء ذلك الجدول كما يلي: 


‘table obama college sex,contents(freq) by(married) 








Responden 


t married 

and Voted Gender and College graduate 

for Obama Male ——————— —— — —— Female 

in 2008 Non college College Non college College 





الأمثلة أعلاه استخدمت الأمر table‏ وقامت بوضع التكرارات في خلايا 
الجداول» ولكن الأمر table‏ يتيح LI‏ إنشاء ملخصات إحصائية؛ فمثلاً الجدول 
الرباعي للمتغير ات obama x college x sex x married‏ يحتوي في كل خلية 
على متوسط العمر age‏ لمجموعة من الخصائص» حيث نرى أن 34 لم 
يتخرجوا في الكلية non-college‏ رجال غير متزوجين لم يصوتوا Listas‏ 
ومتوسط أعمارهم 46.6 سنة. 


-table obama college sex, contents (mean age) 
by (married) 
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Responden 5 
t married 
and Voted Gender and College graduate 
for Obama — Male Female 
in 2008 Non college Coliege Non college College 
2 
No 
No 46.63636 46.91667 60.64706 60 
Yes 55.6 53.45454 63.21053 61.78378 
Yes 
No 56.075 55.92857 58.2 52.35484 
Yes 59 55.87234 53.21053 53.80769 


الخيار contents)‏ مع الأمر table‏ يحدد الإحصائيات التي تحتويها OL‏ 
الجدول. الخيارات لا تتضمن التكرارات أو المتوسطات ehi‏ وإنما تتتضمن 
Lal‏ الانحراف المعياري» وأعلى Aad‏ وأقل قيمةء والوسيط والمدى» 
والنسب المئوية» وملخصات أخرى. وللحصول على قائمة كاملة بهذه 
الخيارات قم بطباعة الأمر help table‏ الجزء التالي من هذا ehaill‏ سوف 
يشرح بعض الاحتمالات الخاصة بالملخصات الإحصائية بالجداول. 


جداول اطتوسطات والوسيط واطلخصات الإحصائية GSW‏ : 


Tables of Means, Medians and Other Summary Statistics 
يقوم بإنشاء جداول للمتوسطات» والانحراف المعياري‎ tabulate الأمر‎ 
على شكل فئات للمتغيرات. بالنسبة للأمثلة المتبقية في هذا الفصل» سوف نعود‎ 
يعرض‎ tabulate لاستخدام بيانات استهلاك الكهرباء بالولايات المتحدة؛ الأمر‎ 
طريقة واحدة لمشاهدة الملخصات الإحصائية لمعدل استهلاك الكهرباء لكل فرد‎ 
(region) لكل إقليم في التعداد السكاني بالولايات المتحدة‎ (elcap) 


.tabulate region9, summ(elcap) 


Summary of Per capita electricity 
use, kWh 
Mean Std. Dev. Freq. 









Census 
Division 
(9) 


















8417.1667 532.95419 
9403.6667 2176.4139 
12726.2 2274.5595 
15169.571 2172.0833 
15011.889 2810.0798 
17948.25 2475.1953 
16279.5 1965.8288 
13877.5 5723.3327 
9534 3073.2846 





New Engla 
Mid Atlan 
E N Centr 
W N Centr 
S Atlanti 
E S Centr 
W S Centr 
Mountain 
Pacific 


URE PR ooN uug 










13318.431 
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كما يمكننا استخدام الأمر tabulate‏ لإنشاء جداول ثنائية للمتوسطات كما 
- هذا المثال» باستخدام تقسيمات الأقاليم الموجودة بالتعداد السكاني للولايات 
المتحدة: 


.tabulate region9 region4, summ(elcap) mean 


Means of Per capita electricity use, kWh 









Census 
Division Census Region (4) 
(9) Northeast Midwest South West Total 










New Engla 8417.1667 8417.1667 
Mid Atlan 9403.6667 1 9403.6667 
E N Centr 12726.2 12726.2 
W N Centr 15169.571 s 15169.571 
S Atlanti 15011.889 15011.889 
E S Centr 17948.25 17948.25 
W S Centr 16279.5 5 16279.5 
Mountain 13877.5 13877.5 

Pacific 9534 9534 












14151.5 16001.059 12206.923 13318.431 





mean. JL yA)‏ : في الأمر أعلاه يحدد بأن الجدول يجب أن يحتوي على 


المتوسطات فقط وإذا لم نقم باستخدام هذا الخيار فإننا سوف نحصل على 
جدول ضخم يحتوي على المتوسطات والانحراف المعياري والتكرارات في 
كل خلية. 


الأمر table‏ : مرن ويستخدم عند إنشاء جداول لسبعة متغيرات» ويحتوي 
الجدول على المتوسطات والانحراف المعياري» والمجاميع؛ والوسيطء 
وإحصائيات أخرى. ولشرح ذلك» فإن الجدول أدناه عبارة عن جدرل أحادي 
uau‏ المتوسطء والانحراف المعياري لاستهلاك الكهرباء للفرد الواحدء كما 
يعرض أيضاً المدى الربيعي للمجتمع لكل إقليم بالتعداد السكاني. 
.table region9, contents‏ 
(mean elcap sd elcap median pop iqr pop)‏ 
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ع uL‏ > د 










Census 


Division (9) mean (elcap) sd(elcap) med (pop) igr (pop) 














8417.17 532.9542 
9403.67 2176.414 12702 10586 


New England 
Mid Atlantic 





E N Central 12726.2 2274.56 9884 5053 
W N Central 15169.56 2172.083 2853 4490 
S Atlantic 15011.9 2810.08 5774 7682 
E S Central 17948.3 2475.195 4559.5 1910 
W S Central 16279.5 1965.829 4142 11506 
Mountain 13877.5 5723.333 2380 2618 
Pacific 9534 3073.285 3831 5365 






معدل استهلاك الكهرباء للفرد الواحد يتباين نتيجة لعامل من اثنين» فهو 
معدل منخفض يساوي 8,417 كيلووات/ساعة في نيوإنجلاند إلى معدل 
مرتفع 17,948 كيلووات/ساعة في وسط الجنوب الغربي (هذا يتتضمن 
الولايات المنتجة للنفط وهي تكساس ولويزيانا وأوكلاهوما). ومن ناحية 
asl‏ فإن أعلى تباين حدث في الولايات الجبلية. حيث إن الانحراف 
المعياري (5,723 كيلووات/ساعة) أعلى بعشر مرات عنه في ولاية 
ني وإنجلاند (533 كيلووات/ساعة). 

الخيار ‘contents()‏ في الأمر «table‏ يحدد الإحصائيات التي D e$‏ 
تظهر في كل خلية لكل متغير. الإحصائيات التي يمكن إدخالها تتضمن أعلى 
قيمة وأقل قيمة والمجموع والنسبة والمئينات وعدة أنواع من الأخطاء 
المعيارية. للحصول على قائمة بهذه الخيارات قم بطباعة الأمر table‏ ماعط. 
استخدام الاوزان التكرارية Using Frequency Weights:‏ 


الأو امر summarize, tabulate, tabe‏ وعدة أو اسن لقو «cs‏ يمكن 
استخدامها مع الأوزان التكرارية التي تشير إلى aae‏ المشاهدات المتكررة. 
فمثلاً المتوسط والإحصائيات الأخرى لاستهلاك الفرد للكهرباء بالولايات 
المتحدة كما يلي: 
.Summ elcap‏ 
Variable Obs Mean Std. Dev. Min Max‏ 


elcap 51 13318.43 4139.328 6721 27457 


الفصل الخامس : الملخصات الإحصائية والجداول 239 
O ee td‏ ا ی ی ا Po‏ 


المتوسط 13,318 كيلووات/ساعة يمثل متوسط استهلاك الكهرباء في 51 
ولاية (بما فيها ضاحية كولومبيا بالعاصمة واشنطن). ويتم اعتبار كل ولاية وحدة 
واحدة» ولاية وايومنج Wyoming‏ التي بها أقل عدد سكان (564 ألف نسمة) 

وأعلى معدل لاستهلاك الكهرباء للفرد الواحد (27,457 كيلووات/ساعة). أما في 
ولاية كاليفورنيا California‏ التي بها أكبر عدد سكان (37 مليوناً) وأقل معدل 
لاستهلاك الكهرباء للفرد الواحد )6,721 كيلووات/ساعة) كل ولاية لها نفس 
الوزن aic‏ حساب المتوسط للولايات 51» ولتوضيح المتوسط لكل فردفي 
GLY gl‏ المتحدة (SS‏ فإنه يجب القيام بوزن axe‏ السكان. 
-summ elcap [fweight = pop]‏ 


Variable obs Mean Std. Dev. Min Max 
elcap 308746 12112.69 3519.441 6721 27457 
المتوسط المرجح لاستهلاك الكهرباء لعدد السكان بالولايات المتحدة‎ 
13,318( كيلووات/ساعة) أقل من متوسط 51 ولاية‎ 12,114( 
كيلووات/ساعة) بسبب كثرة عدد السكان الذين يعيشون في الولايات ذات‎ 
New York ونيويورك‎ California الاستهلاك المنخفض للكهرباء مثل كاليفورنيا‎ 
عن عدد السكان في الولايات ذات الاستهلاك المرتفع للكهرباء مثل وايومنج‎ 


.)3.5 (الشكل‎ Kentucky وولاية كنتاكي‎ Wyoming 
-graph twoway scatter elcap pop, mlabel(state) 
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المتوسط الموزون بعدد السكان لاستهلاك الكهرباء للفرد الواحد يمكن 
شرحه كمتوسط لعدد سكان الولايات المتحدة بالكامل والبالغ 309 ملايين 
نسمة» ويجب ملاحظة أنه لا يمكننا القيام بحساب انحراف معياري موزون 
أو أعلى قيمة أو أقل Aad‏ وذلك بسبب أن أغلب الإحصائيات الفردية لايمكن 
حسابها من بيانات موزونة؛ لأنها مجموعة أصلاً. لذلك علينا التعامل بحذر 
مع الأوزان؛ LAY‏ ذات معنى مع نوع معين من التحليل» ولكنها نادراً ما 
يكون لها معنى مع البيانات ككل عند استخدام أنواع مختلفة من التحليل. 

الأوزان التكرارية تقوم بنفس العمل مع الأمر tabulate‏ والأمر .table‏ 
الأمر أدناه يقوم بحساب المتوسط الموزون لعدد السكان لكل إقليم» وبهذا 
يمكننا أن نأخذ في الاعتبار الولايات ذات الكثافة السكانية الكبيرة حيث 
يمكننا أن نرى من الجدول أدناه أن أصغر متوسط لاستهلاك الكهرباء في 
إقليم الباسفيك „Pacific‏ 


.table region9 [fweight = pop], contents (mean 
elcap) row 













Census 
Division (9) 





mean (elcap) 
















New England 8486.42 
Mid Atlantic 9127.38 
E N Central 12444.7 
W N Central 14374.9 
S Atlantic 13891.4 

E S Central 17819.2 
W S Central 15092.9 
Mountain 11816.9 
Pacific 8089.04 
Total 12112.7 


الخيار row‏ : يحدد أن الصف الأخير يلخص الجدول «JSS‏ فالمتوسط 
الذي حصلنا عليه سابقا عند استخدام الأمر .summarize‏ 


fa)‏ اساوسن 
تحليل التباين وطرق المقارنة الأخرى 


Anova and Other Comparison Methods 








تحليل التباين “ANOVA‏ يتضمن مجموعة من الطرق لاختبار الفرضيات 
حول الاختلافات بين المتوسطات» ويمكن تطبيق هذا التحليل على نطاق 
واسع يمتد من التحليلات البسيطة التي يمكننا من خلالها المقارنة بين متوسط 
المتغير ر من خلال GUE‏ المتغير × » وحتى التحليلات المعقدة مع المتغيرات 
التصنيفية المتعددة والمتواصلة للمتغيرات. اختبار ۲ للفرضيات المتعلقة 
بمتوسط فردي (عينة واحدة) أو بزوج من المتوسطات (عينتان) ترتبط 
بالأشكال الابتدائية لتحليل -ANOVA‏ 

الاختبارات اللامعلمية التي تعتمد على الرتب» مثل اختبار مان وتني» 
واختبار كروسكال واليزء لها طريقتها المختلفة لمقارنة التوزيعات. هذا 
الاختبار يقوم بافتراضات ضعيفة حول القياس وشكل التوزيع والانتشار. 
ولكن تظل هذه الاختبار صالحة إذا توافر لها عدد كبير من الشروط أكثر من 
تلك التي يتطلبها تحليل التباين وعناصره المعلمية. أحياناً قد يقوم المحللون 
باستخدام الاختبارات المعلمية واللامعلمية لفحص ما إذا كانت النتائج تسير 
في اتجاه متشابه» وإذا اختلفت نتائج الاختبارات المعلمية عن نظيراتها 
اللامعلمية» فيجب محاولة الكشف عن هذا الاختلاف» ومحاولة معرفة أسبابه. 

الأمر anova‏ هو أحد أوامر ستاتا النموذجيةء فهو مثله مثل الأوامر 
الأخرى؛ يعتبر مرناً بدرجة كبيرة» ويتضمن عدداً aS‏ من النماذج. فالأمر 
anova‏ يتوافق مع تحليل التباين الأحادي والمتعددء كما أنه متوافق مع التغاير 
(ANCOVA)‏ للتصميمات المتوازنة وغير المتوازنة بما فيها الخلايات 
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المفقودةء كما أنه متوافق مع التصميمات العامليّة» والتصميمات التجريبية 
المتشابكةء والتصميمات المختلطةء وتصاميم القياسات المتكررة. أحد الأوامر 
التابعة الأخرى هو الأمر predict‏ الذي يقوم بحساب القيم المتوقعة لعدة أنواع 
من «cil gill‏ وعدة أخطاء معياريةء والإحصاءات التشخيصية. ويتم استخدام 
هذا الأمر بعد الأمر anova‏ !9 الآخر ql‏ هو test‏ ويقوم بحساب 
الاختبارات التي يحددها المستخدم لاختبار فرضية العدم. الأمر test‏ والأمر 
Dla predict‏ بنفس الطريقة مع yal gh‏ ستاتا الأخرى» التي تتوافق مع 
النماذج مثل الأمر regress‏ الذي ain)‏ شرحه في الفصل 7). 
خيارات قوائم ستاتا أدناه تؤدي إلى القيام Gleb‏ الإحصائيات التي تم 
Statistics » Summaries, tables, & tests » Classical tests of‏ 
hypotheses‏ 
Statistics » Summaries, tables, & tests < Nonparametric tests of‏ 
hypotheses‏ 
Statistics > Linear models and related > ANOVA / MANOVA‏ 


Statistics > Postestimation > Predictions residuals, etc. 
Graphics > Twoway graph (scatter, line etc.) 


Example Commands : loil عن‎ alivi 





.anova y x1 x2 

يقوم بحساب تحليل التباين الثنائي؛ موضحاً الاختلافات بين متوسطات 
المتغير رمن خلال تصنيفات المتغير 1× والمتغير 2د. 

.anova y x1 x2x1#x2 

يقوم بحساب تحليل التباين العاملي ذي الاتجاهين» الذي يتضمن 

التأثيرات الأساسية والتفاعلية (21#22 للمتغيرات التصنيفية 1× و2»» كما 

يمكن تحديد نفس النموذج بالضبط باستخدام الرمز العاملي عن طريق الأمر 

2 بر anova‏ حيث إن (##) لا يسمح فقط بتفاعل 2 وإنما يسمح 

Lal‏ بأي نوع من أنواع تأثيرات المستوى المنخفض والتأثيرات الأساسية 

Ly‏ فيها هذه المتغيرات. (في هذا المثال البسيط هناك تأثيرات أساسية لكل 

من !× و (x2‏ 
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.anova yxl#t#x2##x3‏ 
يقوم بحساب تحليل التباين العاملي ذي الثلاثة اتجاهات؛ وهذا يتضمن 
ثلاثة اتجاهات لتفاعل المتغيرات 2##×3×##/× بالإضافة إلى كل التفاعلات 
الثنائية x x3, x2#x3)‏ ,1422 و التأثيرات الأساسية «Qd, x2, x3)‏ 
.anova reading curriculm / teacher/curriculm /‏ 
يقوم بصياغة نموذج تجريبي متشابك مناسب لاختبار تأثيرات ADE‏ 
أنو اع من المناهج curriculm‏ على قدرة الطلبة على القراءة «(reading)‏ 
و المتغير teacher‏ المعلم متشابك مع curriculm(teacher|curriculum) cil‏ 
لأن مجموعات مختلفة من المعلمين تم تخصيصهم لكل منهج دليل المستخدم 
Base Reference Manual‏ يوضح مع الأمثلة النماذج التجريبية المتشابكة 
الأخرى للتباين» كما يتضمن أيضاً تصميم القطع المنفصل. 


.anova headache subject medication, 
repeated (medication) 


يقوم بجعل نموذج التباين للقياسات المتكررة متناسباً لاختبار تأثيرات 
ثلاثة أنو اع من علاج الصداع (medication)‏ على شذة الصداع «(headache)‏ 
op rias Aga‏ على 20 disi Gaius‏ من piaghia‏ وکل بخص 
استخدم أنواع العلاج الثلاثة في أوقات مختلفة أثناء الدراسة. 
.anova y x1 x2 c.x3 c.x4x2#c.x3‏ 
.regress‏ 
agis‏ بحساب التغاير (ANCOVA)‏ لأربعة متغيرات مستقلةء منها اشان 
تصنيفيان (x7, x2)‏ واثنتان متصلتان x4)‏ ,3<) وبما في ذلك التفاعل بين 
3 2# الأمر الذي يليه وهو regress‏ بدون إضافة أي متغيرات وهو يقوم 
بإنشاء جدول لنتائج الانحدار. 
.kwallis y, by(x)‏ 
يقوم بحساب اختبار كروسكال ويلز لاختبار فرضية العدم للمتغير y‏ 
الذي له توزيع مرتب متشابه لعدد الفئات + للمتغير × حيث إن (2</). 
.oneway y x‏ 
sii‏ بحساب تحليل التباين الأحادي (ANOVA)‏ مختبراً الفروقات بين 
المتوسطات للمتغير رر مع فئات المتغير cx‏ نفس التحليل - مع اختلاف »53 Q‏ 
النتائج - يمكن القيام به باستخدام الأمر × -anova y‏ 
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.Oneway y x, tabulate scheffe 

يقوم هذا الأمرء بحساب تحليل التباين ANOVA‏ متضمناً جدول مخرجات 
لمتوسطات العينة» واختبارات المقارنة المتعددة لشافيه .Scheffé‏ 

.ranksum y, by(x) 

يقوم هذا الأمرء بحساب اختبار مجموع الرتب لويلكوكسن LS)‏ بُعرف 

ay مان وتني) لفرضية العدم والتي يكون فيها المتغير‎ U باختبار‎ Lad 

توزيعات رتب متشابهة لفئات المتغير الثنائي ×. وإذا فرضنا أن توزيعات 

الرتب لها نفس الشكل فهذا يُضيف اختبار! عما إذا كان الوسيطان للمتغير ر 

متساويين. 


.Serrbar ymean se x, scale(2) 
«cala a gall يقوم برسم أعمدة بيانية تمثل الخطأ المعياري من بيانات‎ 
الخطأ‎ se يتضمن مجموعة المتوسطات للمتغير بره والمتغير‎ ymean المتغير‎ 
يحدد بأن‎ seale(2) والخيار‎ ox المعياري» المتغير × يمثل قيم فئات المتغير‎ 
امتداد الأعمدة البيانية يجب أن يكون 2+ للخطأ المعياري حول كل متوسط‎ 
l (£1 (الوضع الافتراضي هو‎ 
.Signrank yl = 2 
لللأزواج المتطابقة ورتب‎ Wilcoxon يقوم بإجراء اختبار ويلكوسن‎ 
ويمكننا‎ y2 الإشارة الذي يختبر تساوي توزيعات الرتب للمتغير 1ر والمتغير‎ 
dli, 23.4 Jia يختلف عن قيمة ثابتة‎ y] اختبار ما إذا كان الوسيط للمتغير‎ 
signrank y1=23.4 بطباعة الأمر‎ 
.Signtest yl = y2 
يختبر تساوي الوسيط للمتغير ١ر والمتغير 2ر (بافتراض أن بيانات‎ 
المتغيرين متشابهة من حيث القياس ونفس مشاهدات العينة)ء استخدام الأمر‎ 
سوف يعرض اختبار الإشارة لفرضية العدم» وهي أن وسيط‎ signtest y] = 5 
4S يساوي‎ yl المتغير‎ 
ettest y= 5 
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يقوم بإجراء اختبار y‏ لعينة واحدة لفرضية العدم التي تفقرض بأن 
متوسط المجتمع للمتغير y‏ تساوي 5. 
.ttest yl - y2‏ 
يقوم بإجراء اختبار : لعينة واحدة (الاختلاف المترابط) لفرضية العدم 
التي تفترض Gh‏ متوسط المجتمع للمتغير #بريساوي نظيره للمتغير Q2‏ 
الوضع الافتراضي لهذا الأمر يفترض ob‏ البيانات مترابطة» فعند اس تخدام 
بيانات غير مترابطة (تم الحصول على بيانات المتغيرين /برو2برمن عينتين 
مستقلتين) فيجب إضافة الخيار -unpaired‏ 
.ttest y, by(x) unequal‏ 
يقوم هذا الأمر بإجراء اختبار ‏ لعينتين لاختبار فرضية العدم التي 
تفترض بأن متوسط المجتمع للمتغير ر هو نفسه لتصنيفات المتغير o‏ لا 
يجب أن يُفترض ob‏ المجتمعات لها تباين متساو (بدون استخدام الخيار 
unequal‏ فإن الوضع الافتراضي للأمر ttest‏ هو اعتبار التباين متساوياً 
للمجتمعات). 
ols‏ العينه الواحدة : One-Sample Tests‏ 
يبدو أن اختبار : للعينة الواحدة له sac‏ تطبيقات منها: 
1- اختبار ما إذا كان متوسط العينة y‏ يختلف بشكل ملحوظ عن القيمة 
المفترضة Ho‏ 
2- اختبار ما إذا كانت متوسطات المتغير ,بر والمتغير Led 5 yp‏ متغيران تم 
قياسهما بنفس المقياس عند جمع قيم المشاهدات ولكنهما يختلفان عن 
بعضهماء وهذا يكافئ اختبار ما إذا كان متوسط متغير نتيجة الاختلاف 
تم إنشاؤه بواسطة طرح ,بر من يبر يساوي صفر. 
يمكننا استخدام نفس المعادلات للتطبيقات أعلاه بالرغم من أن التطبيق 
الثاني يبدأ بمعلومات عن متغيرين اثنين بدلا من متغير واحد. 
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ملف البيانات twriting.dta‏ يحتوي على معلومات تم جمعها لتقييم دورات 
الكتابة بالجامعة olay‏ على معالجة الكلمات (دراسة Nash and Schwartz‏ 
7 القياسات - مثل عدد العبارات الكاملة في الوقت المحدد - تم جمعها 
قبل وبعد إتمام الطلبة للدورة. الباحثون يريدون معرفة ما إذا كانت القياسات 
بعد الدورة شهدت أي تطور. 

.use C:\data\writing.dta, clear 


.describe 
Contains data from C:\data\writing.dta 
obs: 24 Nash and Schwartz (1987) 
vars: 9 2 Jul 2012 06:11 
size: 216 
storage dispiay value 

variable name type format label variable label 
oo 
id byte 58.0 slbi Stuđent ID 

pres byte %8. 0g # of sentences (pre-test 

preP byte $8.0g # of paragraphs (pre-test) 
prec byte %8.0g Coherence scale 0-2 (pre-test) 
preE byte $8.0g Evidence scale 0-6 (pre-test) 
posts byte $8.0g # of sentences (post-test) 
postP byte $8.0g * of paragraphs (post-test) 
postC byte $8.0g Coherence scale 0-2 (post-test) 
postE byte $8.0g Evidence scale 0-6 (post-test) 
Sorted by: 


بافتراض Ud‏ نعرف أن الطلبة خلال السنة الماضية كان معدل إكمال 
الطالب للعبارة هو 10 عبارات» وقبل اختبار مدى تطور مهاراتهم خلال 
الدورة قد نحتاج إلى معرفة مهاراتهم عند بداية الدورة. بعبارة أخرى نحن 
نحتاج إلى معرفة ما إذا كان متوسط العينة قبل الدورة (preS)‏ يختلف بدرجة 
كبيرة عن متوسط الطلبة السابقين (10). وللحصول على اختبار + لعينة 
واحدة لفرضية العدم 0- = Hor‏ نقوم بطباعة الأمر التالي: 


.ttest preS - 0 


One-sample t test 
















Variable Obs Mean Std. Err. Std. Dev. [95$ Conf. Interval] 


24 10.79167 -9402034 4.606037 8.846708 12.73663 






pres 


mean = mean (pres) t= 0.8420 
Ho: mean = 10 degrees of freedom = 23 
Ha: mean < 10 Ha: mean != 10 Ha: mean > 10 


Pr(T < t) = 0.7958 Pr(|T| > |t|) = 0.4084 Pr(T > t) = 0.2042 
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الرمز IPr(T«t)‏ يعني "احتمال أن قيمة توزيع + أقل من قيمة ¢ المشاهدة 
إذا كانت Hy‏ صحيحة" وهذا في حالة اختبارالاحتمال لطرف واحد» Ld‏ اختبار 
الاحتمال لطرفين لقيمة + المطلقةء فإن ذلك يعني 0.4084 = «(5:)11</4 وحيث 
إن الاحتمال مرتفع فليس لدينا أي سبب لرفض Horn = Z0‏ ويجب ملاحظة 
أن الأمر ttest‏ يقوم بالاختبار معتبراً أن فترة الثقة للمتوسط تساوي 9695 
وفترة الثقة هذه تتضمن قيمة فرضية padl‏ 10 ويمكننا أن نرى فترة ثقة 
مختلفة — %90 مثلا — إذا استخدمنا الخيار devel(90)‏ مع الأمر أعلاه. 
النظيراللامعلمي - اختبار التصميم - يستخدم توزيعاً ثنائياً لاختبار 
فرضيات عن قيم وسيط أحادية. فمثلا يمكننا اختبار ما إذا كان الوسيط 
للمتغير pres‏ يساوي 10« الأمر signtest‏ يوضح بأنه لا يوجد سبب لرفض 
فرضية العدم. 
.Signtest pres = 0‏ 





Sign test 
sign observed expected 
positive 12 11 
negative 10 11 
zero 2 2 
all 24 24 
One-sided tests: 
Ho: median of preS - 10 0 vs 


Ha: median of preS - 10 
Pr(#positive >= 12) 


nyn 
o 


Binomial(n = 22, x >= 12, p = 0.5) = 0.4159 
Ho: median of preS - 10 = 0 vs. 
Ha: median of preS - 10 < 0 
Pr(#negative >= 10) = 
Binomial(n = 22, x >= 10, p = 0.5) = 0.7383 


Two-sided test: 
Ho: median of preS - 10 = 0 vs. 
Ha: median of preS - 10 !- 0 
Pr(#positive >= 12 or #negative >= 12) = 
min(1, 2*Binomial(n = 22, x >= 12, p = 0.5)) = 0.8318 
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الأوامر مثل الأمر ttest‏ والأمر signtest‏ تتضمن الذيل الأيمن والذيل الأيسر 
لمنحنى التوزيع والاحتمالات ALLE‏ على خلاف توزيعات ¢ المتماثلة التي 
استخدمها الأمر ttest‏ فإن التوزيعات الثنائية التي يستخدمها الأمر signtest‏ لها 
شكل مختلف للذيل الأيسر والذيل الأيمن لمنحنى التوزيع. في هذا المثال الاحتمال 
الثنائي هو المهم لديناء وذلك لأننا نريد اختبار ما إذا كانت بيانات الطلبة بالملف 
8.6 تختلف عن فرضية العدم وهي أن الوسيط يساوي 10. 
GY‏ سوف نقوم باختبار التطور خلال الدورة وذلك باختبار فرضية 
العدم التي تفترض بأن متوسط عدد العبارات التي يمكن إكمالها قبل وبعد 
الدورة (متو سط المتغير pres‏ ومتوسط المتغير postS‏ متساويان)» الأمر ttest‏ 
يقوم بهذا الاختبار» ويوضح gh‏ هناك تطوراً ملحوظاً. 
.ttest postS = pres‏ 


Paired t test 













Variable (95% Conf. Interval] 





26.375 1.693779 8.297787 22.87115 29.87885 


pres 24 10.79167 . 9402034 4.606037 8.846708 12.73663 


15.58333 1.383019 6.775382 





12.72234 18.44433 


mean(diff) - mean(postS - preS) tz 11.2676 
Ho: mean(diff) - 0 degrees of freedom - 23 
Ha: mean(diff) > 0 Ha: mean(diff) !- 0 Ha: mean(diff) » 0 
Pr(T > t) = 1.0000 Pr(|T| > |ti) = 0.0000 Pr(T » t) - 0.0000 


وحيث إننا نتوقع Wigs!‏ وليس "اختلافا" فقط في متوسطات المتغيرين 
«posts 5 preS‏ فإن الاختبار الأحادي هو الاختبارالمناسب» احتمال الذيل 
الأيمن المعروض يقترب من الصفر. وهذا يعني أن متوسط إكمال الطلبة 
للعبارات تطور بدرجة كبيرة. Sling‏ على بيانات المثال» فإننا على ثقة بدرجة 
5 بأن مهارات الطلبة في كتابة العبارات الكاملة قد زادت بمعدل ما بين 
7 و18.4 عبارة. 
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اختبارات z‏ الاعتيادية: تفترض بأن المتغيرات تتوزع توزيعاً طبيعياً 
حول caer‏ هذه الافتراضية في العادة ليست ذات أهمية بالغةء GY‏ هذه 
الاختبارات تعتبر متوسطة الثقة» ولكن إذا كان عدم الاعتدال يتضمن قيماً 
متطرفة حادة iy‏ يحدث في العينات الصغيرة - فإنه من الأفضل الانتقال 
das ol "m‏ يدلا من المتوسطات» واستخدام اختبار لامعلمي Y‏ يفقرض 
الاعتدال. فعلى سبيل المثال» اختبار ويلكوكسن لرتب الإشارة Wilcoxon‏ 
signed-rank test‏ يفترض أن التوزيع متماثل ومستمر ib‏ وتطبيق اختبار 
الرتب على بيانات المثال السابق»ء سوف يؤدي إلى الحصول على نفس 
النتيجة التي وجدها الأمر test‏ وهي أن هناك fy ght‏ ملحوظاً للطلبة في 
إكمال العبارات. وحيث إن الاختبارين las‏ نفس النتيجةء فإنه بالإمكان 

إقرار ذلك بثقة أكبر. 
.Signrank postS = pres‏ 


Wilcoxon signed-rank test 





sign obs sum ranks expected 







positive 
negative 
zero 


unadjusted variance 1225.00 
adjustment for ties -1.63 
adjustment for zeros 0.00 
adjusted variance 1223.38 


Ho: postS - preS 
z= 4.289 
Prob > |z| = 0.0000 


اختبارات العينئين : Two-Sample Tests‏ 
بقية هذا chaill‏ سوف تشرح أمثلة من بيانات دراسة استقصائية تم 
جمعها من طلبة الجامعة» وقام بالدراسة Ault g Ward‏ في سنة 1990. 


.use "C:\data\student2.dta", clear 
.describe 
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2 à 


Contains data from C:\data\student2.dta 


obs: 243 Student survey (Ward 1990) 
vars: 18 2 jul 2012 06:11 

size: 5,346 
MEME MM MM nr کس ج ج ج‎ 

storage display value 

variable name type format label variable label 
id int %8.0g Student ID 
year byte $9.0g year Year in college 
age byte $8.0g Age at last birthday 
gender byte $9.0g 5 Gender (male) 
relig byte $8.0g v4 Religious preference 
drink byte $9.0g 33-point drinking scale 
gpa float %9.0g Grade Point Average 
grades byte $8.0g grades Guessed grades this semester 
greek byte $9.0g greek Belong to fraternity or sorority 
live byte $8.0g v10 Where do you live? 
miles byte $8.0g How many miles from campus? 
study byte $8.0g Avg. hours/week studying 
athlete byte $9.0g athlete Are you a varsity athlete? 
employed byte $8.0g employ Are you employed? 
allnight byte 58.09 allnight How often study all night? 
ditch byte $8.0g times How many class/month ditched? 
hsdrink byte $9.0g High school drinking scale 
aggress byte $9.0g Aggressive behavior scale 


em 


Sorted by: year 


نحو %19 من الطلبة ينتمون إلى جمعية الطلبة الذكور أو جمعية الطلبة 
الإناث بالجامعة. . في الحرم الجامعي هذه الجمعيات وأعضاؤها يتم الإشارة 
إليهم بأنهم 'يونانيون" ليس بسبب جنسيتهم ولكن لأن أغلب أسماء هذه 
الجمعيات تتألف من حروف يونانية. 

„tabulate greek 
Belong to 


fraternity 
or sorority 








Freq. Percent Cum. 


non-Greek 
Greek 


196 80.66 80.66 


وهناك متغير A)‏ وهو drink‏ يقيس كم مرة وإلى أي مدى الطلبة 
de‏ الكحول» والقياس عبارة عن 33 Ahi‏ الشائعات في الحرم الجامعي 
تقود إلى الظن بأن أعضاء الجمعيات الذكور والإناث يميلون للاختلاف 
عن بقية الطلبة في سلوكهم عند تناول الكحول» رسم الصندوق OU‏ بين 
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الوسيط لقيم المتغير drink‏ للأعضاء وغير celiac YI‏ ورسم أعمدة بيانية 

يُقارن بين المتوسطات. الشكلان يبدو Lel‏ متفقان على قبول مثل هذه 

الشائعات» الشكل )1.6( يجمع بين الشكلين وبعد استخدام الخيار 
ylabel(0(5)25)‏ لجعل قياسات المحور العمودي متناسبة للشكلين معا. 

.graph box drink, over(greek) ylabel(0(5)35) 

saving(fig06 01a) 
.graph bar (mean) drink, over(greek) 
ylabel(0(5)35) saving(fig06 01b) 


.graph combine fig06 01a.gph fig06_01b.gph, 
col(2) iscale(1.05) 


20 25 3 3 
20 25 30 35 


15 


mean of drink 
15 


33-point drinking scale 


10 
10 


5 


0 





e 
non-Greek Greek non-Greek Greek 


الشكل )1.6( 


الأمر 656 الذي تم تطبيقه سابقاً على Aue‏ واحدة واختبارات الاختلاف 
المترابطة يمكن تطبيقها على عينتين. في هذا التطبيق الشكل العام لتركيبة 

Stud ttest measurement, by(categorical) الأمر هو‎ 
.ttest drink, by(greek) 
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Two-sample t test with equal variances 












Mean Std. Err. Std. Dev. [95$ Conf. Interval] 


non-Gree 196 17.7602 - 4575013 6.405018 16.85792 18.66249 

47 24.7234 .7124518 4.884323 23.28931 26.1575 

combined 243 19.107 .431224 6.722117 18.25756 19.95643 

diff -6.9632 .9978608 -8.928842 -4.997558 

diff = meaní(non-Gree) - mean (Greek) t= -6.9781 

Ho: diff = 0 degrees of freedom = 241 
Ha: diff > 0 Ha: diff ! 0 Ha: diff > 0 

Pr(T « t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T » t) - 1.0000 


يمكن أن نلاحظ بأن اختبار : يقوم على افتراض تساوي التباين. ولكن 
التباين في عينة الأعضاء الذكور والإناث - في المثال أعلاه - يبدو أنه أقل 
بطريقة ماء حيث إنهم يتشابهون بدرجة كبيرة في سلوكهم مع الطلبة غير 
الأعضاء في الجمعية» ولإجراء اختبار مشابه بدون افتراض أن التباين 

متساو نقوم بإضافة الخيار unequal‏ كما يلي: 
.ttest drink, by(greek) unequal‏ 


Two-sample t test with unequal variances 

































Group Obs Mean Std. Err. Std. Dev. [95$ Conf. Interval 
non-Gree 196 17.7602 .4575013 6.405018 16.85792 18.66249 
Greek 47 24.7234 .7124518 4.884323 23.28931 26.1575 
combined 243 19.107 .431224 6.722117 18.25756 19.95643 
diff -6.9632 .8466965 -8.645773 -5.280627 
diff mean(non-Gree) - mean (Greek) t = -8.2240 
Ho: diff 0 Satterthwaite's degrees of freedom - 88.22 
Ha: diff > 0 Ha: diff !- Ha: diff » 0 
Pr(T > t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000 


التصحيح لتساوي التباين لا Bb‏ النتيجة الأساسية وهي أن Greeks‏ 
(الأعضاء الذكور والإناث) 5 non-Greek‏ (غير الأعضاء) يختلفان بشكل 
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نياين وطق APT‏ کے 





U يمكننا فحص هذه النتيجة من خلال استخدام اختبار مان وتني‎ be yale 
مرخ الراب الويلفوكييق الذي‎ Jil pally ll الذي رف‎ pale 
ترتيب التوزيعات له نفس شكل المنحنى؛ اختبار مجموع الرتب‎ ob يفترض‎ 
يشير إلى أننا نستطيع أن نرفض فرضية العدم» وهي أن قيم الوسيط في‎ 
المجتمع متساوية.‎ 

.ranksum drink, by(greek) 


Two-sample Wilcoxon rank-sum (Mann-Whitney) test 







greek obs rank sum expected 






196 21111 23912 
47 8535 5734 


non-Greek 
Greek 






combined 243 29646 29646 


unadjusted variance 187310.67 
adjustment for ties -472.30 


adjusted variance 186838.36 
Ho: drink(greek--non-Greek) - drink(greek--Greek) 


Zz = -6.480 
Prob > |z| = 0.0000 


: (ANOVA) النباين الأحادي (ذي الاجاه الواحد)‎ dile 
One-Way Analysis of Variance (ANOVA) 





تحليل التباين (ANOVA)‏ يعتبر طريقة أخرى عامة أكثر من اختبارات 1 
لاختبار الاختلافات بين المتوسطات» أبسط حالات التباين - وهي التحليل 
الأحادي للتباين - يختبر ما إذا كانت المتوسطات للمتغير ر تختلف بين فئات 
المتغير ×. التباين الأحادي يمكن حسابه عن طريق استخدام الأمر oneway‏ 
مع الصيغة العامة oneway measurementcategorical‏ فمثلاً: 


.oneway drinkgreek, tabulate 
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ا 1 او ا ااا ااا bau Arco a‏ 


Belong to 
fraternity 









Summary of 33-point drinking scale 


or sorority Mean Std. Dev. Freq. 
non-Greek 17.760204 6.4050179 196 
Greek 24.723404 4.8843233 47 













6.7221166 





19.106996 


Analysis of Variance 





Source 55 af MS F Prob » F 
Between groups 1838.08426 d 1832.08426 48.69 0.0000 
Within groups 9097.13385 241 37.7474433 

Total 10935.2181 242 45.1868517 
Bartlett's test for equal variances: chi2(1) = 4.8378  Prob»chi2 = 0.028 


الخيار «tabulate‏ يقوم بإنشاء جدول للمتوسطات والانحرافات المعيارية, 
بالإضافة إلى جدول تحليل التباين نفسه؛ تحليل التباين الأحادي مع متغير 
ثنائي × يكافئ اختبار ؛ لعينتين» وتكون قيمة إحصائية F‏ لهذا الاختبار تساوي 
مربع إحصائية «t‏ الأمر oneway‏ يوفر خيارات iS)‏ ويعالج البيانات بسرعة 
أكثرء ولكن ينقصه الخيار unequal‏ الذي يساعد فرضية تساوي التباين. 

الأمر toneway‏ يقوم باختبار فرضية تساوي التباين باس تخدام اختبار 
x^ c‏ ئ فعندما تكون احتمالية بارتليت منخفضة: فهذا يعني أن 
فرضية تساوي التباين غير صحيحة. وفي هذه الحالة» يجب عدم الوثوق في 
نتائج اختبار F‏ للتباين. ٠‏ في المثال أعلاه YI‏ مر oneway drink belong‏ احتمالية 
بارتليت 0.028 = «p‏ مشيراً إلى وجود شكوك حول صلاحية تحليل التباين 
-ANOVA‏ 

القيمة الحقيقية لتحليل التباين الأحادي لا تكمن في قدرته على المقارنة 

بين عينتين» بل في قدرته على المقارنة بين ثلاثة متوسطات أو أكثر. فمثلاً» 

يمكننا اختبار ما إذا كان متوسط سلوك الطلبة يتفاوت لكل سنة في الكلية. في 

الجدول أدناه كلمة "freshman?‏ تشير إلى طلبة السنة الأولى وليس بالضرورة 
أن يكونوا من الذكور. 

.oneway drinkyear, tabulate scheffe 
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Year in 
college 


Summary of 33-point drinking scale 
Mean Std. Dev. Freq. 












Freshman 
Sophomore 

Junior 
Senior 


-9226033 
-5444853 65 
-2866081 75 
-6409257 


21.169231 
19.453333 


DARA 





.106996 .7221166 


Analysis of Variance 


Source 55 df MS F Prob > F 
سس‎ ÀMMM—— a ii 
Between groups 666.200518 3 222.066839 poly i 0.0018 

Within groups 10269.0176 239 42.9666008 

Total 10935.2181 242 45.1868517 

Bartlett's test for equal variances: chi2(3) = 0.5103 Prob>chi2 = 0.917 


Comparison of 33-point drinking scale by Year in college 





(Scheffe) 
Row Mean- 
Col Mean Freshman Sophomor Junior 
Sophomor 2.19423 
0.429 
Junior .478333 -1.7159 
0.987 0.498 
Senior -2.32421 -4.51844 -2.80254 
0.382 0.002 0.103 


يمكننا رفض الفرضية القائلة بأن المتوسطات متساوية )0.0018 - (p‏ 
ولكن لا يمكننا رفض فرضية تساي التباين )0917 = (p‏ النتيجة الثانية تعتبر 
أخبارًا baa‏ حول صلاحية “ANOVA‏ 

رسم الصندوق الأفقي (graph hbox)‏ في الشكل (2.6) يدعم هذه 
asl‏ حيث يعرض تبايناً متشابهاً لكل فئة. وفي الشكل البياني يظهر رسم 
الصندوق محا مع رسم بياني لشكل الانتشار (graph dot(mean))‏ يوضح 
قات لكل فئة. الرسم البياني الموحّد للشكلين يوضح بأن الفروقات بين 

قيم الوسيط (في أعلى الشكل) والفروقات بين المتوسطات (في أسفل الشكل) 
كلاهما تغيرا بطريقة متشابهة. الرسم البياني لشكل الانتشار يوضح نفس 
النقاط التي يوضحها رسم الأعمدة البيانية» فكلاهما يُستخدمان للمقارنة 
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البصرية بين الملخصات الإحصائية لمتغير واحد أو عدة متغيرات» تركيبة 
الأوامر والخيارات لرسم الأعمدة البيانية والرسم النقطي متشابهان 
فكلاهما يتضمن خيارات الملخصات الإحصائية. لمزيد من التفاصيل قم 
بطباعة -help graph dot jay!‏ 
.graph hbox drink, over(year) ylabel(0(5)35)‏ 
saving (fig06_02a)‏ 
.graph dot (mean) drink, over(year)‏ 
ylabel(0(5)35, grid)‏ 
marker(1, msymbol(Sh)) saving(fig06 02b)‏ 


.graph combine fig06 02a.gph fig06 02b.gph, 
row(2) iscale(1.05) 


Freshman 
Sophomore I — — — ae eee —— — — —31 
Junior — — — soi FR — ل‎ | 
Senior m 
0 5 10 15 20 25 30 35 


33-point drinking scale 


Freshman 
Junior 
Senior 





0 5 10 15 20 25 30 35 
mean of drink 


الشكل )2.6( 


الخيار :scheffe‏ (اختبارات المقارنة المتعددة لشافيه (Scheffé‏ مع الأمر 
asi oneway‏ بإنشاء جدول يعرض الفروقات بين كل زوج من المتوسطات» 
فمتوسط المتغير freshman‏ يساوي 18.975 Las sing‏ المتغير sophomore‏ 
يساوي 21.6923 لذا فسوف يكون عبارة عن freshman-sophomore‏ وهو 
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يساوي 21.6923 - 18.975 = 2.19423 وهو ليس بعيداً عن الصفر 
qp = 0.429)‏ وبالنسبة لهذه المقارنات في الجدول أعلاه الفرق الوحيد ذو 
المعنوية هو الفرق بين المتغير senior‏ والمتغير sophomore‏ 16.6508 — 
(p = 0.002) -4.5184 21.1692‏ لذلك فإن النتيجة النهائية هي أن 
da cual dag fI cia al‏ التي oet‏ من CL Jd‏ بين i ual‏ 
بالسنوات المتقدمة بالجامعة seniors‏ (الذين يشربون بنوع من الاتزان)» وبين 
طلبة السنة الثانية sophomores‏ (الذين old‏ في الشرب). 

الأمر coneway‏ يمكنه استخدام خيارات متعددة للمقارنة وهي 
.scheffe, bonferroni, sidak‏ (لمعرفة تعريفات هذه الخيارات انظر دليل 
(Base Reference Manuala Saal‏ اختبار Scheffé‏ يظل bika‏ في حالة 
وجود عدد كبير من الشروط بالرغم من أن هذا الاختبار أقل حساسية أحياناً. 

اختبار كروسكال والس :(kwallis)‏ وتعميم عينة × على مجموع رتب 
عينة ثنائية يعتبران من الاختبارات اللامعلمية» وهما بديل لتحليل التباين لعينة 
RN‏ اهار كرو يقال Cully‏ مر cg gly LUG pant) Suc‏ مر 
الوسيط للمجتمع. 

.kwallis drink, by(year) 


Kruskal-Wallis equality-of-populations rank test 


Freshman 4914.00 


Sophomore 9341.50 
Junior 9300.50 
Senior 6090.00 





chi-squared - 14.453 with 3 d.f. 
probability - 0.0023 

chi-squared with ties - 14.490 with 3 d.f. 
probability - 0.0023 


النتائج (p = 0.0023) eÍ‏ تتفق مع نتائج oneway‏ بأن هناك فروقات 
معنوية في المتغير drink‏ لكل سنة في الكلية. وبصفة dale‏ فإن اختبار 
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كروسال والس يعتبر أكثر أماناً من تحليل التباين ANOVA‏ في حالة وجود 
سبب للشك في فرضيات تحليل التباين التي تفقرض بتساوي التباين أو 
الاعتدال أو في حالة وجود مشاكل بسبب القيم المتطرفة» الأمر kwallis‏ يشبه 
الأمر Cus ranksum‏ إنهما يعتمدان على فرضية ضعيفة» وهي تمائل شكل 
الرتب في التوزيعات لكل cde gone‏ نظر b‏ فإن الأمرين kwallis ; ranksum‏ 
يُفترض أن يقوما باستخراج نتائج متشابهة عند تطبيقهما. على عينتين 
متشابهتين» ولكن في الواقع فإن هذا يكون صحيحا فقط إذا كانت البيانات لا 
تحتوي على أي روابط. الأمر ranksum‏ يحتوي على الطريقة الدقيقة للتعامل 
مع الروابط» وهي طريقة iiaia‏ لمشاكل العينتين. 


: الثباين ذي الاتجاهين واطلعدد‎ dile 


Two- and A-Way Analysis of Variance 





تحليل التباين ذي الاتجاه الواحد يختبر كيف أن متوسطات المتغير ر 
تختلف خلال فئات متغير واحد آخر وهو ×. تحليل التباين المتعدد يقوم بهذا 
التحليل للتعامل مع فئتين أو أكثر من فئات المتغير ×. فعلى سبيل المثال» قد 
نحتاج إلى إعادة النظر كيف أن سلوك الطلبة عند تناولهم للكحول cà Bà,‏ 
ليس فقط بين الطلبة والطالبات أعضاء الجمعيات» ولكن أيضا الاختلاف في 
الجنس. وسوف نبدأ باختبار المتوسطات في جدول ثنائي كما يلي: 
.table greekgender, contents(mean drink) row col‏ 








Belong to 


fraternit 
y or Gender (male) 
sorority Female Male Total 







non-Greek 
Greek 


16.51724 19.5625 17.7602 
22.44444 26.13793 24.7234 





Total 17.31343 21.31193 19.107 


نتائج هذه العينة» توضح بأن الذكور أكثر تناولاً للكحول من «LI‏ 
وأعضاء جمعيات الطلبة من الذكور والإناث أكثر تناولا للكحول من غير 
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الأعضاء في هذه الجمعيات. jill‏ 3( بين Greek/non-Greek‏ يبدو Or NC‏ 
الذكور والإناث. 
الأمر «anova‏ والذي يمكن استخدامه لتحليل التباين المتعددء يمكنه 
اختبار الفروقات المعنوية للأعضاء والجنس (سوف تتم كتابته على هذا 
الشكل "(greekitgender‏ 
.anova drink greek gender greek#tgender‏ 












Number of obs - 243 R-squared - 0.2221 
Root MSE = 5.96592 Adj R-squared = 0.2123 
Source Partial SS af MS F Prob > F 








Model 2428.67237 809.557456 


greek 1406.2366 1 1406.2366 39.51 0.0000 
gender 408.520097 1 408.520097 11.48 0.0008 
greek#gender 3.78016612 1 3.78016612 0.11 0.7448 





Residual 8506.54574 35.5922416 





10935.2181 45.1868517 


في هذا المثال» نتائج تحليل التباين ذي الاتجاهين توضح بأن هناك 
تأثيرات أساسية ذات معنوية لأعضاء الجمعية )0.0000 = greek(p‏ و الجنس 
gender(p = 0.0008)‏ ولكن تفاعلهما يساهم بدرجة ALM‏ في النموذج p=‏ 
GY 0.7448)‏ هذا dela‏ لا يمكن تمييزه عن الصفرء وقد نشير إلى أنه 
يُناسب نموذج huf‏ بدون مصطلح التفاعل. 

لإضافة أي مصطلح تفاعل مع الأمر anova‏ نحدد أسماء المتغيرات 
وربطها مع بعضها بالرمز # (أو ## للتفاعل العاملي). إذا لم يكن عدد 
المشاهدات لكل مجموعة في قيم المتغير × هي نفسهاء فإن (هذا الشرط يُطلق 
عليه البيانات المتوازنة) فقد يكون من الصعب تفسير التأثيرات الرئيسة في 
نموذج ما يتضمن تفاعلات. هذا لا يعني أن التأثيرات الرئيسة في مثل هذه 
النماذج ليست مهمة. تحليل الانحدار قد يساعد في تفسير نتائج تحليل التباين 
المعقدة كما سوف نرى لاحقا في الجزء التالي. 
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: (ANCOVA) pill اطتغيرات العاملية وتليل‎ 
Factor Variables and Analysis of Covariance (ANCOVA) 


الأمر canova‏ والعديد من أوامر التقدير ببرنامج ستاتاء تسمح بتحديد 
المتغيرات المستقلة وكتابتها في متغير عاملي. فقبل كتابة اسم متغير مستقل 
نضع قبله الرمز i‏ والذي يحدد لبرنامج ستاتا أن هذا المتغير يتضمن متغيرًا 
تنبؤياً (ثنائياً) لمستويات متغير تصنيفي» لأن كل تصنيف له تفرعاته الثنائيةء 
المتغيرات التصنيفية والتي يسبقها الرمز d.‏ يجب أن تحتوي على أعداد 
صحيحة موجبة من 0 إلى 32,740 والأمر anova‏ سوف يقوم بشكل 
افتراضي باعتبار كل المتغيرات المستقلة متغيرات تصنيفية. لذا قم بطباعة 
الأمر التالي: 

.anova drink greek year greekiyear 

كما يمكن تنفيذ نفس النموذج بطباعة الأمر: 
.anova drink i.greek i.year i.greek#i.year‏ 


2043 R-squared = 0.2265 
5.99962 Adj R-squared = 0.2034 


Number of obs 
Root MSE 





F Prob > F 







Source Partial ss 













Model 2476.29537 353.756482 
1457.93596 1 12457.93596 40.50 0.0000 
217.492051 3 2 2.01 0.1127 


148.508479 3 49.5028264 1.38 0.2510 


greek 
year 
greek#year 







35.9954159 





Residual 8458.92273 





10935.2181 45.1868517 


وكما هي العادة مع تحليل التباين ANOVA‏ يمكننا الحصول على نظرة 
مباشرة للنموذج الضمنيء وذلك بإعادة شرح التحليل على أنه تحليل انحدار» 
وبرنامج ستاتا يقوم بذلك Äl ogun‏ فقط قم بطباعة الأمر regress‏ مباشرة بعد 


أمر 2 بدون إضافة أي متغيرات. 


.regress 
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Source df Number of obs - 243 

F( 7, 235) - 9.83 

Model 2476.29537 7 353.756482 Prob > F = 0.0000 

Residual 8458.92273 235 35.9954159 R-squared = 0.2265 

Adj R-squared = 0.2034 

10935.2181 242 45.1868517 Root MSE = 6 

drink Coef. Std. Err. k P>jt| [95% Conf. Interval] 

l.greek 7.805556 3.162076 2.47 0.014 1.575917 14.03519 
year 

2 1.138889 1.322791 0.86 0.390 -1.467156 3.744934 

3 . 3648776 1.268844 0.29 0.774 -2.134884 2.864639 

4 -3.043501 1.295774 22,395. 0.020 -5.596319 -.4906827 
greek#year 

12 -.7859477 3.586922 -0.22 0.827 -7.852579 6.280683 

T3 -3.614878 3.58588 -1.01 0.314 -10.67945 3.4497 

14 1.643501 3.778548 0.43 0.664 -5.800655 9.087657 

—cons 18.19444 . 9999363 18.20 0.000 16.22446 20.16443 





gl Lay‏ مجاميع مربعات اختبار F‏ و۸ وتفاصيل أخرى متطابقة 
لمکافئ تحليلات الأمر anova‏ والأمر «regress‏ كما أن جدول regress‏ يوفر 
تفاصيل أكثر من أمر 2 ويمكننا مشاهدة كل قيمة من قيم المتغير year‏ 
حيث تم معاملة هذا المتغير كمؤشر للتنبؤء حيث إننا نرى ob‏ طلبة السنة 
الأولى من فئة مختلطة في هذا الجدول. 

لذا فإن المُعاملات في السنة الثانية والثالثة والرابعة تظهر عكس مُعَامل 
السنة الأولى؛ non-Greek laa y] ye ial Adel Anal P‏ كان معدل 
تناولهم المشروبات الكحولية ASÍ‏ من )1.14( في حين أن هذا المعدل كان 
منخفضاً as‏ في السنة الرابعة (3.04-) مقارنة بطلبة السنة الأولى؛ 
مُعاملات متغير السنة year‏ متعلقة بمُعاملات لمتغيرات وهمية تم ترميزها 
بالرقم 1 لسنة معينة و0 لأي Aiu‏ أخرىء» معاملات المتغير greek‏ متعلقة 
بمعامل متغير وهمي تم ترميزها بإعطاء رقم 1 للأعضاء Greek‏ و0 لغير 
الأعضاء .non-Greek‏ 
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تحليل التغاير (ANCOVA)‏ يمتد لعدد ١‏ طريقة لتحليل التباين ANOVA‏ 
ليشمل خليطاً من متغيرات × التصنيفية والمتصلةء المحدد e.‏ والذي يسبق 
ae‏ من الأوامرء يقوم بتحديد متغير مستقل معين كمتغير مستمر» وتتم 
معاملة قيمه كقياسات بدلاً من معاملتها كقيم مستقلق ونقون تحت فشات 
معينة» قد يمكننا معاملة متغير year‏ كمتغير متصل. 

.anova drink i.greek c.year i.greek#c.year 


Number of obs - 243 R-squared 
Root MSE - 6.06334 Adj R-squared 


0.1965 
0.1864 


n 







Source Partial 8 F Prob > F 
















Model 2148.60352 716.201174 0.0000 


greek 186.474269 1 186.474269 5.07 0.0252 
year 147.628787 1 147.628787 4.02 0.0462 
greek#year .203073456 1 .203073456 0.01 0.9408 


Residual 8786.61458 36.7640778 










10935.2181 45.1868517 





-regress 
Source ss df MS Number of obs - 243 
EC 3g 239) = 19.48 
Model 2148.60352 3 716.201174 Prob » F - 0.0000 
Residual 8786.61458 239 36.7640778 R-squared = 0.1965 
Adj R-squared = 0.1864 
Total 10935.2181 242 7 Root MSE - 6.0633 





[95% Conf. Interval] 












1.greek 
-year 


6.776657 3.00897 . 8491681 12.70415 
-1.103421 .4068558 -2.71 0.007 -1.904902 -.3019392 


greekic.year 
1 .0789217 1.061895 0.07 0.941 -2.012947 2.17079 


20.69328 1.164985 





18.39833 





22.98823 


الشكل الجديد للنتائج بعد معاملة السنة year‏ كمتغير متصل Yau (eyear)‏ 
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«lel‏ ولكن R‏ المعدلة توضح Gh‏ هذه النسخة من النتائج غير متناسبة 
)0.1864 مقابل 0.2034(« الإصدار التصنيفي للنتائج يوضح بأن معدل 
تناول الشراب مرتفع في السنة الثانية )1.14+( مقارنة مع السنة الأولى؛» 
ومرتفع SUE‏ في السنة الثالثة )0.36+( مقارنة بالسنة الأولى» ولكنه أقل 
بكثير في السنة الرابعة (3.04-) مقارنة بالسنة الأولى. النتائج التي تم 
استخراجها بناءً على المتغيرات المتصلة كشفت ارتفاع وانخفاض بسيط 
بمتوسط انخفاض بلغ 1.10- في السنة. 

معاملة متغير year‏ كمتغير تصنيفي أو متصل يرجع للمحلل نفسه بناءً 
على أسباب إحصائية أو موضوعية» المتغيرات الأخرى مثل تقدير الطالب 
(gpa)‏ فهي بوضوح متغيرات Alaia‏ فعندما نقوم بإدخال المتغير gpa‏ ضمن 
المتغيرات المستقلةء فإننا نجد أنه Laf‏ مرتبط بسلوك الطلبة في تناول 
الكحول. هذا النموذج يمزج التأثيرات التفاعلية والتي لم يتم إثبات بأنها ذات 
معنوية؛ GY‏ المتغيرات التصنيفية هي الوضع الافتراضي بالنسبة للأمر 
أما الخيار الذي يسبق المتغير وهو (Sadi,‏ إدخاله مع المتغير greek‏ 
أو متغير gender‏ 

.anova drink greek gender © . 3 


Number of obs - 218 R-squared = 0.2970 
Root MSE = 5.68939 Adj R-squared = 0.2872 











Source Partial ss df MS E Prob » F 


Model 2927.03087 3 975.676958 30.14 0.0000 
greek 1489.31999 1 1489.31999 46.01 0.0000 
gender 405.137843 1 405.137843 12.52 0.0005 

gpa 407.0089 1 407.0089 12.57 0.0005 


Residual 6926.99206 







32.3691218 





9854.02294 





45.4102439 
من هذا التحليل» يمكننا معرفة وجود علاقة ذات معنوية بين سلوك 
المتغير greek‏ و المتغير gender‏ كمتغير ات ضابطة» ويجب ملاحظة أن 
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اختبارات F‏ للمعنوية الإحصائية لا تعرض معلومات تفصيلية عن كيفية 
ترابط المتغيرات» ويُعتبر تحليل الانحدار أفضل من غيره للقيام بذلك. 





regress 
Source 55 df MS Number of obs - 218 
F( 3, 214) = 30.14 
Model 2927.03087 3 975.676958 Prob > F = 0.0000 
Residual 6926.99206 214 32.3691218 R-squared - 0.2970 
Adj R-squared = 0.2872 
Total | 9854.02294 217 45.4102439 Root MSE = 5,6894 
es يي‎ SS 
drink Coef. Std. Err. t pP»|t| [95$ Conf. Interval] 
1.greek 6.547869 .9653204 6.78 0.000 4.645116 8.450623 
l.gender 2.808418 .7938269 3.54 0.000 1.243697 4.373139 
gpa -3.038966 .8570168 -3 55 0.000 -4.728241 -1.34969 
—cons 24.72871 2.539529 9.74 0.000 19.72301 29.7344 


القيم المتوقعة والرسم البياني oae‏ الخطا : 
Predicted Values and Error-Bar Charts‏ 
الأمر anova‏ يليه الأمر predict‏ الذي يقوم بحساب القيم المتوقعة 
والبواقي أو الأخطأ المعيارية والإحصائية التشخيصية. أحد استخدامات مثل 
هذه الإحصائيات هو رسم بياني يمثل نتائج النموذج» مثل الرسم البياني 
لأعمدة الخطأ. لشرح ذلك سوف نعود إلى تحليل التباين ذي الاتجاه الواحد 

.year ومتغير‎ drink لمتغير‎ 

.anova drink year 





Number of obs - 243 R-squared = 0.0609 

Root MSE = 6.55489 Adj R-squared = 0.0491 

Source Partial ss df MS 2 Prob > F 
Model 666.200518 3 222.066839 5.17 0.0018 
year 666.200518 3 222.066839 5.17 0.0018 


Residual 10269.0176 239 42.9666008 


Total 10935.2181 242 45.1868517 
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لحساب المتوسطات المتوقعة من تحليل anova‏ نقوم بطباعة الأمر 
predict newvarl‏ حيث *newvarl? C)‏ يمكن أن Os‏ أي اسم متغير تريد 
معرفة متوسطاته LÍ «Ax giall‏ الأمر predict newvar2,stdp‏ يقوم eL 3b‏ 
tia‏ تان جديد بتري على الأخطاء المعيارية للنتوسطات Ax all‏ 


.predict drinkmean 
.predict SEdrink, stdp 


باستخدام المتغيرين الجديدين وهما المتغير drinkmean‏ و المتغير SEdrink‏ 
ias‏ حساب 5 Lys‏ من فترات II‏ وهي عبارة عن المتوسطات 
laii;‏ أو Lass‏ 2 الأخطاء المعيارية» الرسم البياني لأعمدة الخطأ في الشكل 
(3.6) تحتوي على رسم بياني في أعلاه رؤوس مدببة (reap)‏ لأعمدة الخطأء 
وتم تركيب رسم بياني آخر فوقه لخط متصل (connect)‏ للمتوسطات. 

.gen drinkhi drinkmean + 2 * SEdrink 

gen drinklo drinkmean - 2 * SEdrink 

.graph twoway rcap drinkhi drinklo year, 

color (maroon) 

|| connect drinkmean year, lwidth(medthick) 
color (maroon) 

|| r y1abel(14(1)23, grid gmin gmax) 
ytitle("Drinking scale") 

legend(off) text(18 2 "Mean "-char(177)'2SE", 

box margin(small)) 


Drinking scale 
15 16 17 18 19 20 21 22 23 


14 


sy. 1 "m 
4 


Year in college 


الشكل )3.6( 
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الشكل )3.6( يحتوي على عدد من الخيارات الأخرى لجعل الشكل أكثر 
وضوحاء فالخياران connects reap‏ تم إعطاؤهما نفس اللون 
«color(maroon)‏ ومربع شرح الرسم تم إيقافه عن طريق كتابة الخيار 
(legend (of)‏ وذلك في مقابل مربع نصّي صغير لتوضيح أن الرسم البياني 
يعرض ”2258 Mean‏ وعلامة الزائد أو الناقص + عبارة عن الرمز 177 
في ASCII‏ والتي تم تمثيلها في الأمر بواسطة '=char(177)'‏ الشكل )16.3( 
في Jail‏ )3( يعرض مجموعة كاملة من رموز ASCI‏ المتوافرة للاستخدام 

في الرسومات البيانية ببرنامج ستاتا. 

الشكل )6 .3( بهذه الطريقة يزودنا بمقدمة للأمر predict‏ والذي له العديد 
من التطبيقات في النماذج الإحصائيةء وهناك طريقة أخرى لرسم أعمدة 
الخطأ وذلك عن طريق استخدام الأمر margins‏ والأمر Cus «marginsplot‏ 
يقوم الأمر margins‏ بحساب المتوسطات الحدية أو المتوسطات المتوقعة بعد 
أمر النموذج الإحصائي» أما الأمر marginsplot‏ فيقوم بعرض بياني لكل هذه 
الحسابات. ففي المثال أدناه الأمر margins year‏ يقوم بحساب قيم المتوسط 
للمتغير drink‏ لكل سنة» ثم يقوم الأمر marginsplot‏ بإنشاء رسم بياني مع 
فترة الثقة الخاصة c;‏ الشكل )4.6( عبارة عن شكل واضح ولكن ليس 
بالإمكان تطبيق العديد من خيارات الأمر twoway‏ على الأمر -marginsplot‏ 


margins year 
.marginsplot 


Adjusted Predictions of year with level(95)% Cis 


Linear Prediction 
18 20 
كت لد‎ 





" -———————— 
Freshman Sophomore Junior Senior 
Year in college 


الشكل )4.6( 
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بالنسبة لاختبار التباين العاملي ذي الاتجاهين» فإن أعمدة الخطأ تساعدنا 
في معاينة التأثيرات التفاعلية والرئيسة. ففي المثال أعلاه» Lid‏ باس تخدام 
مقياس للسلوك العدواني 5 وتم اعتباره P uasa‏ تابعا. في تحليل التباين 
العاملي كل من المتغير year‏ والمتغير gender‏ وشرط التفاعل genderüyear‏ 
جميعها تعتبر مؤشرات تنبؤء وفي ضوء العلاقة غير الخطية» فإن تأثيرات 
المتغير year‏ يمكن مشاهدتها في الشكل )6 .3( والشكل )6 .4( لهذا التحليل. 
ويمكننا قبول التعامل الافتراضي للمتغير year‏ وهي معاملته كمتغير تصنيفي 
بدلاً من اعتباره متغیرا متصلا. كما أن اختبارات F‏ توضح بأن متغير 
gender‏ ومتغير year‏ وشرط gender#tyear Je‏ جميعها لها تأثرات 





معنوية. 
.anova aggress gender year gender#tyear‏ 
Number of obs - 243 R-squared = 0.2503‏ 
Root MSE - 1.45652 Adj R-squared - 0.2280‏ 





Source Partial SS 










F 













Model 166.482503 23.7832147 
gender 
year 
gender#year 


94.3505972 1 94.3505972 44.47 0.0000 
19.0404045 3 9 2.99 0.0317 
24.1029759 3 9 3.79 0.0111 


Residual 498.538073 235 1 








665.020576 242 2.74801891 


(and‏ باستخدام الأمر predict‏ لحساب متغير جديد يحتوي على 
المتوسطات المتوقعة» واستخدمنا predict, stdp‏ لحساب الأخطاء A hall‏ 
الحدود العليا والدنيا لفترة الثقة تساوي تقريباً زائد أو ناقص 2 الأخطاء 
المعيارية. لتمثيل شرط التفاعل gendertyear‏ بيآنياً سوف نستخدم الأمر 
graph‏ لإنشاء Q&A‏ )5.6( مع الخيار by(gender)‏ لرسم JU al‏ بيانية 
منفصلة تمثل الذكور والإناث. بعض الخيارات الأخرى تقوم بالتحكم في 
التفاصيل الثانوية الأخرى مثل العلامات بالرسم البياني (علامات ماسيّة 
45 كبيرة) وإيقاف ظهور كل من مربع شرح الرسم البياني degend‏ 
ومربع الملاحظات cnote‏ ويمكننا Laf‏ رسم مربعات صغيرة بخلفية بيضاء 


268 الإحصاء مع برنامج ستاتا 





حول نص ”0100258 والتي يجب وضعها بعناية في Jalo‏ الرسم» بحيث 
لا تغطي أي بيانات داخل الرسم نفسه. 

.predict aggmean 

.predict SEagg, stdp 

.gen agghi = aggmean + 2 * SEagg 

.gen agglo = aggmean - 2 * SEagg 

.graph twoway rcap agghi agglo year 

|| connect aggmean year,  lwidth(medthick) 

msymbol (D) 

|| , by(gender, legend(off) note("")) 

ytitle("Aggressive behavior scale") 

text (1.7 2 "Mean "-char(177)'2SE", box 

margin(small) bfcolor(white)) 








Female Male 

$ 
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8 - 
32 

o 
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Year in college 
(5.6) الشكل‎ 


يمكن إنشاء رسم بياني آخر لأعمدة الخطأ بطريقة أسرع باستخدام الأمر 

margins‏ و الأمر -marginsplot‏ الأمر margins gender#year‏ يحسب القيم 

المتوقعة أو المتوسطات للمتغير «drink‏ موضحاً في الرسم ذاته الجنس 

gender‏ و السنة «ear‏ ثم يقوم الأمر marginsplot, by(gender)‏ بإنشاء الرسم 
البياني لهذه المتوسطات مع فترات الثقة لكل جنس (الشكل 6.6). 

margins gender#year 

-marginsplot, by (gender) 
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Adjusted Predictions of gender#year with level(95)% Cls 
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الشكل )6.6( 


الشكل (5.6) والشكل (6.6) يضيفان تفاصيل حول الجنسء والتأثيرات 
التفاعلية والتي تم حسابها بواسطة الأمر anova‏ فمتوسطات الإناث في 
مقياس السلوك العدواني» شهدت بعض التقلبات مقارنة بمستوياتها المنخفضة 
خلال السنوات الأربع في الكلية» LÍ‏ متوسطات الذكور فكانت أعلى خلال 
الفترة مع بلوغها أقصى مستوى لها في السنة الثانية مشابهة للنمط الذي 
رأيناه سابقاً لسلوك الطلبة في تناول الكحول (الشكل 2.6 والشكل 3.6). لذا 
فإن العلاقة بين المتغير aggress‏ الذي يمثل مقياساً للسلوك العدواني» ومتغير 
السنة year‏ تختلف من الذكور للإناث. الرسومات البيانية لأعمدة الخط' هي 
عبارة عن تكملة مرئية لجداول anova jay!‏ والأمر cregress‏ فالرسومات 
البيانية تم إنشاؤها Sly‏ على بيانات تلك الجداول؛ بينما الجداول تؤكد على أن 
التأثيرات ذات معنوية. وهذه الجداول تعرض تفاصيل رقميةء إلا أن استخدام 
الرسومات البيانية يساعد في فهم معني هذه التأثيرات. 








تحليل الانخدار الخطي 


Linear Regression Analysis © 











"Gta!‏ يوفر ac‏ كبيرًا من طرق تحليل الانحدار. يمدذنك $el‏ قائمة 
جزئية 4 بالطرق المحتملة عن طريق طباعة الأمر -h lp regress‏ هذا الفصل 
LET.‏ على الانحدار البسيط› والانحدار المتعددء Laus‏ طريقة المربعات 
الصغرى العادية (OLS)‏ والتي يمكن القيام بها باس تخدام الأمر cregress‏ 
والأوامر الأخرى المتعلقة بهذا الأمر. الطرق التشخيصية والبيانية التي تأتي 
بعد تحليل الانحدارء عبارة عن امتداد لأدوات تحليل الانحدار وتساعد في 
تفسير النتائج» كما أنها تكشف وتتعامل مع الأمور المعقدة في التحليل. الأمر 
regress‏ باستطاعته القيام ببعض التحليلات الأخرى غير تحليل المربعات 
الصغرىء وهذه التحليلات تتضمن المربعات الصغرى المرجحة. وسوف يتم 
شرح طرق التحليل الانحدار الأخرى في الفصل (8) والفصول اللاحقة له. 
القوائم التالية تمكنك من الوصول للعمليات المطلوبة لتحليل الانحدار. 
Statistics < Linear models and related < Linear regression‏ 
Statistics < Linear models and related » Regression diagnostics‏ 
Graphics < Twoway graph (scatter, line, etc.)‏ 
Statistics > Postestimation > Predictions, residuals, etc.‏ 
Statistics > Postestimation > Marginal means and predictive‏ 


margins 
Statistics > Postestimation > Margins plots and profile plots 


Interpreting and في مقال‎ à FUSE العديد من‎ ass الانحدار > ويمكنك أن‎ 
Visualizing Regression Models Using Stata (Mitchell 2012). 
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أمثلة عن الأوامر : Example Commands‏ 


.regress y x 


يقوم هذا الأمر بحساب الانحدار بطريقة المربعات الصغرى العادية 
(OLS)‏ للمتغير بر على متغير تنبؤي x‏ 


.regress y x if ethnic == 3 & income > 50 & 
income « . 


يحسب انحدار y‏ على × مستخدماً Ie ja‏ فقط من البيانات والتي فيها 
المتغير ethnic‏ يساوي 3« والمتغير income‏ أكبر من 50 (وليست هناك قيم 
مفقودة). 
.predict yhat‏ 
إنشاء متغير جديد (تم تسميته UW pe‏ باسم (yhat‏ وهو يساوي القيم 
المتوقعة من أحدث تحليل للانحدار. 
.predict e, resid‏ 
إنشاء متغير جديد (تم تسميته جزافياً باسم (e‏ وهو يساوي بواقي أحدث 
تحليل للانحدار. 
.predict new, cooksd‏ 
إنشاء متغير جديد يساوي مسافة كوك Cook's Distance‏ ملخصاً كيف أن 
كل مشاهدة تؤثر في النموذج المقترح. 
.predict new, covratio‏ 
إنشاء متغير جديد يساوي إحصائية بلسلي وكو وولسك Belsley, Kuh and‏ 
«Welsch, COVRATIO)‏ وهذه الإحصائية تقيس تأثير الحالة ith‏ على مصفوفة 
التباين - التغاير للمعاملات المقذرة. 
.predict DFx1, dfbeta(x1)‏ 
إنشاء إحدمائية حالة DFBETAS‏ التي تقيس كيف أن كل مشاهدة تؤثر 
على مُعَاملات المتغير التنبؤي 1»» ولإنشاء مجموعة متكاملة ل DFBETAS‏ 
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لكل المتغيرات التنبؤية في النموذج قم بطباعة الأمر dfbeta‏ بدون إضافة أي 
شيء آخر. 
.predict new, dfits‏ 
يقوم بإنشاء إحصائيات 285775 التي تلخص تأثير كل مشاهدة على 
النموذج المقترح (هو نفس الهدف الذي تسعى إليه مسافة كوك وإحصائية 
ويلسك). 
-graph twoway lfit y x || scatter y x‏ 
يقوم بإنشاء رسم بياني موضحاً خط الانحدار البسيط jan)‏ خط 
التطابق) مع شكل الانتشار للمتغير رمع المتغير x‏ 
.graph twoway mspline yhat x |]! Scatter y x‏ 
يقوم بإنشاء رسم بياني موضحاً خط الانحدار البسيط مع شكل انتشار 
للمتغير رمع المتغير x‏ وذلك بواسطة خط واصل ae)‏ مكعبات منتشرة تحت 
المنحنى) بين القيم المتوقعة للانحدار (في هذا المثال تم تسميتها «(yhat‏ 
وهناك العديد من الطرق البديلة لرسم خطوط الانحدار وهذه الطرق تتضمن 
mspline, mband, line, Iit, Ifitci, qfit, qfitci, marginsplot‏ وكل طريقة لها 
ميزاتها وخياراتها. 
-graph twoway scatter e yhat, yline(0)‏ 
يقوم برسم بياني للبواقي والقيم المتوقعة باستخدام المتغيرات yhat 5 e‏ 
كما يمكن إنشاء نفس الرسم بطباعة الأمر rvfplot‏ (البواقي) بعد تحليل 
الانحدار الناتج وإنشاء الرسم البياني. 
.regress y x1 x2 x3‏ 
يقوم بحساب الانحدار المتعدد للمتغير رمع ثلاثة متغيرات تنبؤية هي 
xl, x2, x3‏ 
.test x1 x2‏ 
يقوم بحساب اختبار F‏ لفرضية العدم التي تفترض أن المعامل 1× 
والمعامل x2‏ مساويان للصفر في آخر نموذج الانحدر. 
.regress y x1 x2 x3, vce(robust)‏ 
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يقوم بحساب الثقة (هيوبر/ وايت) (Huber/White)‏ التي تقذ تقر الأخطاء 
المعياريةء انظر دليل المستخدم User's Guide‏ لمزيد من التفاصيل؛ الخيار 
vee(robust)‏ يعمل كذلك مع العديد من الأوامر الأخرى الملائمة للنموذج. 
.regress y x1 x2 x3, beta‏ 
يقوم هذا الأمر بحساب الانحدار المتعدد» ويقوم بتضمين مُمَاملات 
الانحدار المعياري (أوزان ب بيتا) في جدول المخرجات. 
correlate x1 x2 x3 y‏ 
يقوم بإنشاء مصفوفة ارتباطات بيرسون مستخدماً المشاهدات التي لا توجد 
بها قيم مفقودة في كل المتغيرات التي تم إدراجها في الأمرء عند إضافة الخيار 
covariance‏ فسوف يتم إنشاء مصفوفة التغاير - التباين Yu‏ من الارتباط. 
.pwcorr x1 x2 x3 y, sig star(.05)‏ 
يقوم بإنشاء مصفوفة ارتباطات بيرسون مستخدماً الحذف الثنائي للقيم 
المفقودة ويعرض احتمالات اختبار + لفرضية pdd‏ و = = :و4 لكل his)‏ 
لارتباطات GIS‏ معنوية إحصائية (في هذا المثال 0.05 (p<‏ سوف يتم الإشارة 
ليها بعلامة النجمة (*). 
.graph matrix x1 x2 x3 y, half‏ 
يقوم برسم مصفوفة الانتشارء وحيث إن المتغيرات المدرجة هي نفسها التي 
تم استخدامها في الأمر السابق» فهذا المثال يقوم بإنشاء شكل الانتشار ويجعله 
منظماً بالطريقة التي al‏ بها الأمر pweorr‏ عند إنشاء مصفوفة الارتباط» وعند 
إدراج المتغير المستقل (y)‏ في آخر الأمرء فإن هذا يعني إنشاء مصفوفة فيها 
الصف السفلي عبارة عن سلسلة لنقاط المتغير y‏ مع نقاط المتغير x‏ 
.estat hottest‏ 
يقوم هذا الأمر بحساب اختبار كوك وويسبرج Cook and Weisberg's test‏ 
لاختلاف التباين cheteroskedasticity‏ وإذا كان لدينا سبب للشك بأن اختلاف 
التباين هو Allo‏ لمتغير تنبؤي معين x]‏ فيمكننا التركيز على ذلك المتغير 
التنبؤي» وذلك بطباعة الأمر × cestat hettest‏ وللحصول على قائمة كاملة 
بالخيارات المتوافرة مع الأمر regress‏ قم بطباعة الأمر help regress‏ 
cpostestimation‏ توجد اختيارات مختلفة للتقدير البعدي للنماذج. 


.estat ovtest, rhs 
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يقوم بحساب اختبار خطأ محدد انحدار رمزي Ramsey regression‏ 
specification error test‏ للمتغيرات المهملة» الخيار rhs‏ يتطلب استخدام قوى 
متغيرات الطرف الأيمن للمعادلة بدلاً من القوى المتوقعة للمتغير بر(وهو 
الخيار الافتراضي). 

.estat vif 

يقوم بحساب عوامل تضخم التباين لاختبار التعدد الخطي 

-multicollinearity 
.estat dwatson 

يقوم بحساب اختبار دوربن واتسون Durbin-Watson‏ للارتباط الذاتي من 
الدرجة الأولى في السلاسل الزمنية لبيانات Jail «(tsset)‏ )12( يوضح 
AB‏ عن هذا الاختبار وبعض الإجراءات الأخرى في السلاسل الزمنية. 

-acprplot xi, mspline msopts (bands (7) ) 

يقوم بإنشاء رسم بياني للمكونات المدمجة زائداً البواقي يعرف Lad‏ 
باسم الرسم البياني للبواقي الجزئية المدمجة) في العادة أفضل من الأمر 
cprplot‏ في فحص عدم الخطيّة «nonlinearity‏ الخيار mspline‏ 
msopts(bands(7))‏ يقوم بإنشاء خط متصل للربط بين قيم الوسيط في سبع 
نطاقات عموديةء أو ge Ya‏ ذلك يمكننا إنشاء منحنى خفيف منخفض بعرض 
5 وذلك من خلال الخيارات -lowess Isopts(bwidth(.5))‏ 

.avplot x1 

يقوم بإنشاء رسم بياني لمتغير إضافي (يطلق عليه Cad‏ اسم انحدار 
qi‏ أو شكل التأثير) يعرض العلاقة بين المتغير بر والمتغير 1× وكلاهما 
تم ترجيحهما للمتغيرات الأخرى ox‏ مثل هذه الأشكال تساعد على معرفة القيم 
المتطرفة ونقاط التأثير. 

.avplots 

يقوم بإنشاء رسم بياني يتضمن صورة واحدة لكل الرسومات البيانية 

-regress jay! أو‎ anova PES | للمتغير ات المضافة أخير‎ 
.Cprplot x1 
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يقوم بإنشاء رسم بياني للمكون زائداً الباقي (يُعرف أيضاً باسم الرسم 
البياني للبواقي الجزئية) يعرض العلاقة المعدلة بين المتغير بر والمتغير 
التنبؤي Shey oc‏ هذه الأشكال تساعد في التعرف على العلاقات غير الخطبّة 


في البيانات. 
.lvr2plot‏ 
يقوم بإنشاء رسم بياني للتأثير مع تربيع البواقي (يُعرف Laj‏ باسم 
شكل (L-R‏ 
.rvfplot‏ 


يقوم برسم البواقي مع القيم المتوافقة (المتوقعة) للمتغير y‏ 
.rvpplot x1‏ 
يقوم برسم البواقي مع قيم المتغير التنبؤي xd‏ 
.regress y x1 x2 i.catvar i.catvartc.x2‏ 
يقوم بحساب انحدار المتغير بر على المتغيرات التنبؤية x2‏ ,1× 
ومجموعة من المتغيرات الوهمية التي يتم إنشاؤها بشكل تلقائي لتمثل فئات 
المتغير catvar‏ ومجموعة من شروط التفاعل التي تساوي المتغيرات الوهمية 
مضروبة في قياس (مستمر) المتغير 2:» للحصول على معلومات أكثر عن 
هذا الأمر قم بطباعة الأمر „help fvvarlist.‏ 
.Stepwise, pr(.05): regress y x1 #2 £3‏ 
يقوم بحساب الانحدار المتدرج مستخدماً التقريب حتى تصبح جميع 
المتغيرات التنبؤية المتبقية GIS‏ معنوية عند مستوى 0.05. كل المتغيرات 
التنبؤية المدرجة يتم إدخالها في أول تكرارء لذا فكل تكرار يقوم بحذف 
متغير تنبؤي واحد له أعلى مستوى ثقة p‏ حتى تصبح احتمالات كل 
المتغيرات التنبؤية المتبقية أقل من احتمال الإبقاء عليه (05):م» هناك عدة 
خيارات تسمح بالتقدم أو الاختيار الهرميء الأمر stepwise‏ يعمل العديد من 
أوامر النماذج الإحصائية الأخر ى» وللحصول على قائمة بهذه الخيارات قم 
بطباعة الأمر help stepwise‏ - 


.regress y x1 x2 x3 [aweight - wl 
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يقوم بحساب انحدار المربعات الصغرى المرجحة (WLS)‏ للمتغير بر 
على المتغيرات orl, x2, x3‏ المتغير w‏ يقوم بالاحتفاظ بالأوزان التحليلية» 
والقيام بهذا أشبه بقيامنا بضرب كل متغيرء وكل ثابت في الجذر التربيعي 
للمتغير « ثم حساب الانحدار. الأوزان التحليلية في العادة يتم اس تخدامها 
لتصحيح اختلاف التباين Laie heteroskedasticity‏ يكون المتغير ر والمتغير x‏ 
عبارة عن متوسطات أو معدلات أو نسبء ويكون المتغير w‏ عبارة عن عدد 
أفراد (مدن أو مدارس.. الخ) تمثل مجموع كل مشاهدة في البيانات» وإذا 
كان المتغير بر والمتغير × تمثل مستويات فردية وأوزانها تشير إلى عدد 
المشاهدات المتكررة:؛ فيمكننا استخدام الأوزان التكرارية «[fweight = w]‏ قم 
بطباعة الأمر help survey‏ للحصول على معلومات عن الأوزان التي تعكس 
عناصر التصميم مثل العينات غير المتناسبة (انظر الفصل 4). 

.Svy: regress y x1 x2 x3 

يقوم هذا الأمر بحساب الانحدار المرجح بالدراسة الاستقصائية للمتغير 
y‏ على المتغيرات x], +2, x3‏ مفترضاً بأن نوع البيانات الاستقصائية تم تحديده 
سابقاً باستخدام الأمر svyset‏ (انظر الفصل 4). 
Just‏ البسيط : Simple Regression‏ 

الملف Nations2.dta‏ يحتوي على بيانات عن مؤشرات التنمية البشرية 


للأمم المتحدة لعدد 194 دولة. 


.use C:\data\Nations2.dta, clear 
-describe country region life school chldmort 





adfert gdp 
storage display value 

variable name type format label variable label 

country str21 5 Country 

region byte $8.0g region Region 

life float $9.0g Life expectancy at birth 2005/2010 

school float %9.0g Mean years schooling (adults) 
2005/2010 

chldmort float %9.0g Prob dying before age 5/1000 live 
births 2005/2009 

adfert float %8.0g Adolescent fertility: births/1000 
fem 15-19, 2010 

gdp float %9.0g Gross domestic product per cap 


2005$, 2006/2009 


.summarize life school chldmort adfert gdp 
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Variable Obs Mean Std. Dev. Min Max 
life 194 68.7293 10.0554 45.85 82.76666 
school 188 7.45922 2.959589 115 12.7 
chldmort 193 47.65026 52.8094 2,25 209 
adfert 194 51.81443 44.06612 1 207.1 
gdp 179 12118.74 13942.34 279.8 74906 


العمر المتوقع (life)‏ يُظهر تبايناً واضحاً من دولة لأخرىء فمثلاً الشكل 
(1.7) يوضح أن العمر المتوقع يبدو أنه أقل في أفريقيا عنه في الأماكن 

الأخرى. 
.graph box life, over(region) marker(1,‏ 


mlabel (country) ) 
© Australia 
w Zealand 
7 . 
© Haiti 


© Angola 


90 
erit 


80 
cp d 


60 
AL 


Life expectancy at birth 2005/2010 
70 


50 
1 





© Afghanistan 


- 


Africa Americas Asia Europe Oceania 


الشكل )1.7( 


إلى أي مدى يمكن شرح التباين في العمر بناءً على متوسط فترة التعليم 
والثروة لكل فرد ومؤشرات التنمية الأخرى؟ قد نقوم بدراسة تأثيرات التعليم 
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التعليم» يمكن كتابة أمر الانحدار ببرنامج ستاتا على الشكل Cus regress yx‏ 
إن بر يمثل المتغير التابع أو المتوقع» xg‏ يمثل المتغير المستقل أو التنبؤي. 


.regress life school 













Source 55 df Ms Number of obs = 188 
Pe WU. 186) = 206.34 

Model 9846.65406 1 9846.65406 Prob > F = 0.0000 
Residual 8875.86926 186 72 R-squared 2 0.5259 
Adj R-squared - 0.5234 

18722.5233 187 100.120446 Root MSE - 6.9079 

life Coef. Std. Err. t P»|t| [95$ Conf. Interval] 
School 2.45184 .1706856 14.36 0.000 2.115112 2.788569 
_cons 50.35941 1.36924 36.78 0.000 47.65817 53.06065 





Les‏ هو متوقعء فإن العمر المتوقع يميل ليكون أعلى في الدول التي بها 
عدد سنوات التعليم أعلى. من السابق لأوانه تفسير هذه النتتائج عند هذه 
النقطةء ولكن جدول الانحدار يعطي معلومات عن علاقة إحصائية خطيّة بين 
العمر المتوقع aac g life‏ سنوات التعليم «school‏ في الجزء الأيمن العلوي من 
الجدول يمكننا أن نرى نتيجة اختبار ” والتي تم إجراؤها بناء على مجموع 
التربيعات في الجزء الأعلى الأيسر بالجدول. اختبار GS Fo‏ فرضية العدم 
والتي تكون جميع مُعَاملاتها في جميع متغيرات × في النموذج (في مثالنا هذا 
هناك متغير x‏ واحد وهو (school‏ يساوي صف رأ إحصائية F‏ 206.34 مع 
درجات حرية 1 و186 تشير بشكل واضح إلى رفض فرضية العدم 
(0000. = م التي تشير إلى أربعة أرقام بعد الفاصئة العشريةء وهذا يعني أن 
«(p< .00005‏ فعندما يكون Prop > F‏ فهذا يعني "احتمالية أن إحصائية F‏ تكون 
كبيرة" ]13 Lud‏ باستخراج العديد من العينات العشوائية من المجتمع الذي 
تكون فيه فرضية العدم صحيحة. 


في الجانب الأعلى الأيمن» يمكننا أن نرى معامل التحديد 0.5259 = CR?‏ 
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المعدلة 0.5234 = R,‏ تأخذ في الاعتبار ada‏ النموذج بالمقارنة إلى تعقيد 
البيانات. 

النصف السفلي من جدول الانحدارء يوت ضح النموذج المناسب نفسه»ء 
حيث نجد أن المُعَاملات (الميل والتقاطع مع المحور الرأسي) في العمود 
الأول chile Xa‏ للمتغير school‏ تساوي 2.45184 u—‏ مع المحور 
الأفقي (تم إدراج المُعامل (conse‏ بالعمود الأول وهي تساوي 50.35941 
وبهذا فإن معادلة الانحدار للعمر المتوقع سوف تكون : 


life = 50.36 + 2.45school‏ المتوقع 


كل سنة إضافية في عدد سنوات التعليم سوف تؤدي إلى زيادة العمر 
المتوقع بمقدر 2.45 سنة. هذه المعادلة تقتر بأن العمر المتوقع هو 50.36 
سنة في الدولة التي يكون فيها متوسط سنوات التعليم صفراء هذا بالرغم من 
أن أقل قيمة في aac‏ سنوات التعليم بالبيانات الموجودة لدينا هو 1.15 سنة 
(وهو في دولة موزمبيق). 

العمود الثاني» يعرض الأخطاء المعيارية المقترة للمُحاملات» وهذه 
الأخطاء يمكن استخدامها لحساب اختبارات + (الأعمدة 4-3) وفترات )33 à‏ 
(الأعمدة 6-5( لكل معامل من مُعَاملات الانحدار» إحصائيات ,(المُعَاملات 
قسمة أخطائها المعيارية) تختبر فرضيات العدم التي تفترض ol‏ مُعَاملات 
المجتمع المتناظرة تساوي l yia‏ عندما تكون مستويات الثقة عند 0.05 -» 
أو 0.001 = a‏ يمكننا رفض فرضية العدم المتعلقة بالمُعاملين الخاصين بمتغير 
7 وتقاطع المحور العموديء GY‏ الاحتمالين يظهران على أنهما ”0,000“ 
(وهذا يعني أن 0.0005 > = (p‏ وفي العادة فإن حسابات ستاتا تعرض فترات 
ثقة عند مستوى 7695 ولكن نستطيع إضافة مستويات أخرى لفترات à xp‏ 
وذلك من خلال تحديدها بالخيار devel)‏ فمثلاً لعرض فترة ثقة عند مستوى 
9 قم بطباعة الأمر 


.regress life school, level(99) 
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بعد تحديد نموذج الانحدار يمكننا إعادة عرض النتائج بطباعة الأمر 
regress‏ فقط بدون إضافة أي متغير ات «s A‏ طباعة الأمر regress, level(90)‏ 
سوف يُعيد النتائج» وهذه المرة يعرض فترة ثقة %90. وحيث إن بيانات 
الملف Nations2.dta‏ التي تم استخدامها في هذا المثال لا تمثل عينة عشوائية 
من بعض المجتمعات في بعض الدول» فإن اختبارات الفرضيات وفترات الثقة 
تفتقد للتفسير الواقعي. 

12.7 ما بين 1-15 إلى‎ xu il قى يعض‎ pala cl ga la gia 
ماذا يمكن لمتوسط العمر المتوقع أن يفعل مع نموذج التوقع للدول الموجودة‎ 
لديناء فمثلاً ماذا يعني أن متوسط سنوات التعليم هو 2 أو 12؟ الأمر‎ 
يوفر طريقة سريعة لمراجعة المتوسطات المتوقعة مع فترات ثقتها‎ margins 
واختبارات 2 (والتي تكون في العادة غير مهمة) وما إذا كانت هذه‎ 
"التخفيض العمودي" يقلل عدد‎ vsquish المتوسطات تبتعد عن الصفرء الخيار‎ 
الأسطر الخالية بين الصفوف في الجدول.‎ 


.regress life school, level(99) 


Adjusted predictions Number of obs - 188 
Model VCE : OLS 

Expression : Linear prediction, predict() 

l..at : School = 2 

2._at : school = 12 







Delta-method 
Std. Err. 2 P» |z| [95$ Conf. Interval] 












Margin 









55.26309 1.059291 52.17 0.000 53.18692 57.33927 
79.78149 -9244047 86.31 0.000 77.96969 81.59329 





عندما يكون المتغير school‏ يساوي 2( فإن متوسط العمر المتوقع 
يساوي 55.26 سنة مع فترة A‏ تتراوح بين 53.19 إلى 57.34 وعندما 
يكون المتغير school‏ يساوي 2» فإن متوسط العمر المتوقع يساوي 79.78 
سنة مع فترة ثقة تتراوح بين 8 إلى 81.59« ويمكننا الحصول على 
متوسطات العمر المتوقع لقيم المتغير school‏ عند فترة ثقة سنة واحدة من 2 
إلى 12 ونتائج الرسم البياني وذلك بطباعة أمرين اثنين هما: 


282 الإحصاء مع برنامج ستاتا 


.margins, at(school = (2(1)12)) vsquish 
.marginsplot 
يعبّر عن ثابت الانحدار» وهو في‎ cons في جدول الانحدار المصطلح‎ 
يساوي الميل على المحور‎ cons. العادة يساوي واحد (إذن قيمة معامل‎ 
d العمودي). ستاتا يقوم تلقائياً بتضمين ثابت معين ما لم نقم نحن بتغيير‎ 
يجعل ستاتا يقوم بإيقاف الثابت» ويقوم بحساب الانحدار‎ nocons والخيار‎ 
باستخدام المعادلة الأصلية:‎ 
.regress y x, nocons 
في بعض التطبيقات» قد نحتاج إلى تحديد ثابت معين» فإذا كانت‎ 
مثلاً) يستخدم‎ c متغيرات الطرف الأيمن تتضمن ثابتاً قمنا بتحديده (اسمه‎ 
.nocons من الخيار‎ ya hascons الخيار‎ 
.regress y c x, hascons 
في هذا الموضع يؤدي إلى نتائج مضللة في‎ nocons استخدام الخيار‎ 
لمزيد من المعلومات عن الخيار ئ قم بالاطلاع على‎ oR? y F اختبار‎ 
- help regress أو قم بطباعة الأمر‎ Base Reference Manual JA 


الانحدر مع متغير تنبؤي واحد للحصول على خط مستقيم يتناسب بشكل 
كبير مع انتشار البيانات» مع تحديد "أفضل تناسب" بواسطة معيار طريقة 
المربعات الصغرى (OLS)‏ هناك طريقة سهلة لرسم هذا الخط في داخل 
شكل الانتشار (twoway | scatter)‏ مع تناسب خطي Qfit)‏ في الرسم البياني 
نفسه؛ الأمر أدناه يقوم بإنشاء نسخة مبمتطة (لن يتم عرضها هنا). 


.graph twoway scatter life school || 1£it life 
school 


الشكل (2.7) يعرض نسخة أفضل لاغيا مربع شرح الرسم ومدرجا 
معادلة الانحدار كنص» أسماء المتغيرات school life‏ تم كتابتها بخط مائل 
في الرسم البياني. 
.graph twoway scatter life school || 1fit life‏ 
school š‏ 


|| , legend(off) ytitle("Life expectancy in 
years") 
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ES EE ee‏ ت 


text (85 4 "predicted {it:life} = 50.36 + 
2.45(it:school)") 


$A 


predicted //fe = 50.36 + 2.45schoo/ 


80 


اليب 








2 4 6 8 10 12 
Mean years schooling (adults) 2005/2010 


الشكل )2.7( 


Correlation : bWyW 


الانحدار بطريقة المربعات الصغرى (OLS)‏ يُظهر خط التناسب 
المستقيم» ومُعامل ارتباط لحظة التوقع لبيرسون يشرح كيف يمكن لخط 
التناسب أن يظهر بشكل أفضلء الأمر correlate‏ يقوم بحساب الارتباطات 
للمتغيرات المدرجة بالأمر: 
.correlate gdp school adfert chldmort life‏ 


(obs=178) 







gdp school adfert chidmort life 


gdp 





school 1.0000 
adfert -0.5121 -0.6798 1.0000 
chldmort -0.5160 -0.7724 0.7888 1.0000 
life 0.6062 0.7313 -0.7424 -0.9294 1.0000 
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الأمر 61216 : يحسب الارتباطات بناءً على المشاهدات الموجودة في 
كل المتغيرات المدرجة بالأمر. من الجدول أعلاهء يمكننا أن نرى أن هناك 
8 دولة Lid‏ من أصل 194 دولة في ملف البيانات Nations2.dta‏ لديها 
بيانات كاملة للمتغيرات الخمسة جميعاًء هذه الدول 178 تتشابه مع مجموعة 
فرعية من المشاهدات التي يمكن استخدامها في النماذج المتناسبة مثل تحليل 
الانحدار المتعدد الذي يتضمن كل هذه المتغيرات. 

المحللون لا يستخدمون الانحدار أو تقنيات متعددة المتغيرات» ولكن 
ربما يفضلون حساب الارتباطات بناءً على كل المشاهدات المتوافرة لكل 
زوج من المتغيرات» الأمر 6 (الارتباط الثنائي) يقوم بإجراء هذه 
الحسابات؛ كما يمكن أيضا إجراء احتمالات اختبار + لفرضية العدم لكل 
ارتباط فردي يساوي clita‏ في المثال أدناه الخيار star(.05)‏ يطلب وضع 
نجمة (*) للارتباطات ذات معنوية إحصائية" عند مستوى ثقة 0.05 = a‏ 


.pwcorr gdp school adfert chldmort life, 





star(.05) 
gdp school adfert chldmort life 
gdp 1.0000 
school 0.5733* 1.0000 
adfert -0.5171* -0.6752* 1.0000 
chldmort -0.5160* -0.7727* 0.7774* 1.0000 
life | 0.6112* 0.7252* -0.7318* -0.9236* 1.0000 


هذا الأمر مهم» وسوف نستخدمه cis‏ ولكن إذا قمنا باستخراج العديد 
من العينات العشوائية من مجتمع فيه ارتباط كل المتغيرات يساوي ص فرًاء 
فإن نحو %5 من ارتباطات العينات سوف تكون ذات معنوية إحصائية عند 
مستوى ثقة 0.05( المحللون المبتدئون الذين يختبرون العديد من الفرضيات 
الفردية مثل تلك التي في مصفوفة cpweorr‏ لتحديد الجزء ذي المعنوية 
الإحصائية عند مستوى ثقة 0.05 نقوم بحساب مخاطرة الحصول على الخطأ 
من النوع الأول عند مستوى أعلى من 60.05 هذه المشكلة يُطلق عليها أحياناً 
خطأ المقارنات المتعددة الأمر pweorr‏ يعطي طريقتين لتعديل مستويات 
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اا c — ee,‏ 
المعنوية وأخذ مشكلة خطأ المقارنات المتعددة في الاعتبار. وهاتان الطريقتان 
هما بونفيروني وسيداك Bonferroni and Sidak‏ بالطبع طريقة سيداك ليست 
دقيقة» ولكن احتمالات اختبار المعنوية يمكن تعديله لعدد المقارنات التي تم 
إجراؤها. 


.pwcorr gdp school adfert chldmort life, sidak 
sig star(.05) 


gdp School adfert chldmort life 





School 0.5733" 1.0000 
0.0000 
adfert -0.5171* -0.6752* 1.0000 


0.0000 0.0000 


chldmort -0.5160* -0.7727* 0.7774* 1.0000 
0.0000 0.0000 0.0000 


life 0.6112* 0.7252* -0.7318* -0.9236* 1.0000 
0.0000 0.0000 0.0000 0.0000 


التعديلات لها تأثيرات بسيطة على الارتباطات المعتدلة والقوية» كما في 
الجدول codle!‏ ولكن هذا قد يكون Lege‏ جداً مع الارتباطات الضعيفة أو مع 
عدد أكثر من المتغيرات. وبشكل عام كلما زادت المتغيرات التي نقوم 
بحساب ارتباطاتهاء فإن الاحتمالات المعدلة سوف تزيد عن نظيراتها غير 
المعدلة. انظر دليل المستخدم Base Reference Manual‏ للحصول على تفاصيل 
أكثر عن الأمر oneway‏ للمعادلات المستخدمة. 

وحيث إن ارتباطات بيرسون تقيس إلى أي مدى خط الانحدار OLS‏ 
متناسب» فإن متل هذه الارتباطات تشترك مع فرضيات ونقاط ضعف OLS‏ 
وبشكل cle‏ فإن الارتباطات لا ينبغي تفسيرها دون النظر إلى شكل الانتشار 
المتعلق بهاء ومصفوفات شكل الانتشار تعتبر طريقة سريعة للقيام بهذه 
العملية» وذلك باستخدام نفس التنظيم كمصفوفة ارتباطء الشكل )12.3( في 


286 الإحصاع مع برنامج ستاتا 





الفصل )3( يعرض مصفوفة شكل الانتشار المتعلقة بالأمر pweorr‏ التي تم 
ذكره dida‏ الوضع الافتراضي هو قيام الأمر graph matrix‏ بحذف ثنائي 
مثل ما يقوم به الأمر cpweorr‏ لذا فإن کل شكل انتشار صغير يعرض كل 
المشاهدات الموجودة فعلا في زوج المتغيرات الموجود بالأمر. 

للحصول على مصفوفة شكل انتشار تتوافق مع correlate yi‏ أو 
لانحدار المتعدد من كل المشاهدات التي بها قيم مفقودة مهملة يجب علينا 
تعديل الأمر. إحدى طرق التعديل تتم باستثناء المشاهدات التي بها قيم مفقودة 
T‏ أي متغير مدرج بالأمرء وذلك باستخدام دالة (missing)‏ (الشكل 3.7). 

.graph matrix gdp school adfert chldmort life 


if !missing(gdp,school,adfert,chldmort,life), 
half msymbol(*) 


Gross 
domestic 
product per 
cap 2005$, 
2006/2009 


Mean years 
schooling 
(adults) 
2005/2010 












Adolescent 
fertility: 
births/1000 
fem 15-19, 








Prob dying 
before age 
5/1000 live 
births 
2005/2009 


Life 
j expectancy 
Pia at birth 
* 2005/2010 


T T T LE ERE 
0 50000 100000 5 10 19 100 2000 100 200 


الشكل )3.7( 


























+ اپ“‎ qc 


الشكل )3.7( يوضح أشياء لم توضحها مصفوفة LLG YI‏ حيث إن 
العلاقات التي تتضمن GDP‏ لكل فرد هي بوضوح علاقات غير Abs‏ 
وبالتالي فإن مُعَاملات الارتباط أو الانحدار الخطي تعطي شرحا غير واضح 
لهذه العلاقات واختباراتها المعنوية غير صالحة. 
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إضافة الخيار covariance‏ بعد الأمر agi correlate‏ باستخراج مصفوفة 
للتباين والتغاير Yay‏ من الارتباطات. 
-correlate w x y Zz, covariance‏ 
قم بطباعة الأمر أدناه بعد تحليل الانحدار» فسوف يعرض الارتباط بين 
المُعَاملات dall "o PE Ee‏ أحياناً لتشخيص وجود مشكلة التعدد 
-multicollinearity NT‏ 


.estat vce, correlation 
الأمر أدناه سوف يعرض المُعاملات المقدّرة لمصفوفة التباين — التغاير‎ 
والتي تم منها استخراج الأخطاء المعيارية.‎ 

estat vce 

بالإضافة إلى ارتباطات بيرسون» فإن برنامج ستاتا يمكنه Lajf‏ حساب 

aac‏ من الارتباطات Ant fll‏ وهذه الارتباطات يمكن اس تخدامها لقياس 

العلاقات بين المتغيرات الترتيبية أو بديل مضاد القيم المتطرفة لارتباط 

بيرسون لحساب المتغيرات» وللحصول على ارتباط الرتب لسبيرمان بين 

متغير life‏ ومتغير school‏ وهو مكافئ لارتباط بيرسون إذا تم وضع هذه 
المتغيرات في شكل ترتيبي» قم بطباعة الأمر 

-spearman life school 


Number of obs 
Spearman's rho 


188 
0.7145 


Test of Ho: life and school are independent 
Prob > |t| = 0.0000 


Kendall’s t, (tau-a) and <, (o) وتاو‎ ( Í ) تاو‎ Mast رتب الارتباطات‎ 
كان حجم الا ات‎ gly لیک البيانات» ی‎ Lgs Ladle) (Ky Cab) 

di as‏ فإن حساباتها سوف تكون بطيثة 
-ktau life school‏ 


Number of obs = 188 
Kendall's tau-a = 0.5142 
Kendall's tau-b = 0.5149 
Kendall's score = 9039 
SE of score = 862.604 (corrected for ties) 


Test of Ho: life and school are independent 
Prob > |z| = 0.0000 (continuity corrected) 
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لغرض المقارنة» سوف agi‏ بحساب ارتباط بيرسون مع قيمة p‏ غير 
المعدلة كما يلي: 


.pwcorr life school, sig 


life school 





school 0.7252 1.0000‏ 
0.0000 
في هذا المثال قيمة الأمر spearman‏ )0.71( وقيمة pweorr )—4Jl‏ 
Lads (0.73)‏ تعرض ارتباطات أعلى من الأمر ktau.‏ (0.51)؛ كل هذه 
النتائج الثلاث تتفق بأن فرضيات العدم التي تفترض عدم وجوج علاقة يمكن 
رفضها. 
jus‏ أطتعدد : Multiple Regression‏ 


Jasiyl‏ البسيط والارتباط أظهرا ob‏ العمر المتوقع يرتبط بمتوسط عدد 
سنوات الدراسة school‏ حيث إن axe‏ سنوات الدراسة تشرح حوالي %52 
من التباين في العمر life‏ ولكن هذه العلاقة قد تكون مفاجئة وحدثت هذه 
النتيجة فقط لأن المتغيرين يعكسان الوضع الاقتصادي في الدولة؟ هل متغير 
مدة التعليم يعتبر متغيراً Lage‏ عندما نتحكم في التباين بين الدول؟ هل هناك 
عوامل Aug‏ بع ba fa, gite‏ التعليم يمكن أن تشرح بنسبة أكبر من 
2 التباين في العمر المتوقع؟ الانحدار المتعدد يقوم بالإجابة عن مثل هذا 
النوع من الأسئلة. 
يمكننا إدراج متغيرات تنبؤية أخرى محتملة لمتغير dife‏ وذلك بإضافة 
هذه المتغيرات في الأمر regress‏ فمثلاً الأمر التالي سوف يقوم بحساب 
انحدار العمر المتوقع على الناتج المحلي الإجمالي لكل فرد GDP‏ ومعدل 
الخصوبة ومعدل وفيات الأطفال. 
.regress life school gdp adfert chldmort‏ 
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Ee‏ ب 
النتائج من الأمر السابق لم يتم إظهارها هناء لأنها سوف تكون مضللة» 
ونحن نعلم من الشكل )3.7( gdp Ob‏ يعرض بوضوح علاقة غير خطية مع 
المتغير © والمتغيرات الأخرى» من المفترض أن نعمل مع شكل آخر 
للمتغير gdp‏ بحيث يعرض هذا المتغير علاقات خطية أكثر» اللوغاريتمات 
هي الخيار الأكثر وضوحاً وانتشاراً للتحويل» وبعد إنشاء متغير جديد يساوي 
لوغاريتم الأساس 10 للمتغير gdp‏ الشكل )4.7( يؤكد بأن علاقات gdp‏ مع 
المتغيرات الأخرى تبدو أقرب لتكون خطية بالرغم من استمرارية بقاء بعض 
العلاقات غير الخطية. 
generate loggdp = 1og10(gdp)‏ 
.label variable loggdp "log10 (per cap GDP)'‏ 
.graph matrix gdp loggdp school adfert chldmort‏ 
life‏ 


if !missing(gdp,school,adfert,chldmort,life), 
half msymbol (dh) 








Mean years 

schooling 
(adults) 

2005/2010 


Prob dying 
before age 
s1000 live 


i 
2005/2009 











كوكس - بوكس Lilla cBox-Cox‏ سوف نركز على المتغير loggdp‏ ونستعمله 
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في الأمثلة القادمة. حساب انحدار العمر المتوقع على متوسط فترة التعليم 
ولوغاريتم GDP‏ ومعدل الخصوبة ومعدل الوفيات يشرح حوالي 9688 من 


.regress life school loggdp adfert chldmort 











Source SS df MS Number of obs = 178 
F( 4, 173) = 321.24 

Model 15545.2558 4 3886.31395 Prob > F = 0.0000 
Residual 2092.93402 173 12.0978845 R-squared - 0.8813 
Adj R-squared = 0.8786 

17638.1898 177 99.6507898 Root MSE = 3.4782 





Coef. Std. Err. t P>|t| [95$ Conf. Interval] 











School -.2339704 .1558288 -1.50 0.135 -.5415407 .0735999 
loggdp 4.052938 .8133392 4.98 0.000 2.447592 5.658283 
adfert -.0004683 .0096839 -0.05 0.961 -.019582 .0186455 
chldmort -.1511827 .0098966 -15.28 0.000 -.1707163 -.131649 
_cons 62.2544 3.114434 19:99 0.000 56.10722 68.40158 


معادلة الانحدار المتعدد تكون كما يلي: 
life = 62.25 - 0.23school + 4.05loggdp - 0.00adfert — 0.15chldmort‏ المتو a‏ 

Cus‏ إن المعادلة أعلاه تعطينا صورة مختلفة عن الانحدار البسيط 

السابق. 
life = 50.36 + 2.45school‏ المتوقع 

عندما نتحكم في المتغير ات الثلاثة الأخر «s‏ فإن مُعَامل المتغير school‏ 
APT Mace‏ (0.23- ضد 2.45+( وليس ذا معنوية إحصائية 
تمكننا من تمييزه عن الصفر )0.135 = «(t7 -1.50, p‏ معدل الخصوبة له 
معامل واحد على عشرين من الخطأ المعياري من الصفرء وهذا بالطبع ليس 
ذا دلالة إحصائية أيضا )0.961 = م ,0.05- > ). ومن ناحية أخرىء CI‏ 
المتغيرين loggdp, chldmort‏ لهما تأثير ات جوهرية وذات معنوية إحصائيةء 
العمر المتوقع يميل ليكون أعلى في الدول الغنية التي تتميز بانخفاض 
معدلات وفيات الأطفال. 

dala‏ معدل وفيات الأطفال 1 يوضح بأن العمر المتوقع ينخفض 
بمعدل 0.15 سنة عند ارتفاع معدل وفيات الأطفال بمقدار نقطة واحدة في حالة 
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بقاء المتغيرات التنبؤية الأخرى على حالهاء معامل loggdp‏ يشير إلى زيادة العمر 
المتوقع بمعدل 4.05 سنة عند كل زيادة في الناتج المحلي الإجمالي لكل فرد 
(الناتج المحلي الإجمالي أس 10( عند ثبات كل المعدلات الأخرىء الناتج المحلي 
الإجمالي لكل فرد يتباين بدرجة كبيرة في البيانات الموجودة لدينا بمعدل أكبر من 
مائة ضعف» حيث إنه يتراوح من 279.8 دولار/ للفرد (جمهورية الكونفو 
الديمقراطية) إلى 74,906 دولار/ للفرد (قطر). 

الأربعة متغيرات التنبؤية معأ تشرح حوالي 9688 من التباين في العمر 
المتوقع (0.8786=.)» وتعتبر R,‏ المعدلة إحصائية مختصرة مفضلّة في حالة 
الانحدار المتعددء لأنها من غير المحتمل أن تعذل RYR=0.8813)‏ كما أن Ry‏ 
تفرض جزاء عند إنشاء نماذج معقدة Lalla R chap‏ سوف تزداد عتدما تقوم 
بإضافة متغيرات تنبؤية أكثرء ولكن R^‏ ربما لا تسلك نفس المسلك. 


التأثير القريب من الصفر للمتغير s adfert‏ وضعف تأثيره؛ والتأثير غير 
المعنوي للمتغير school‏ تشير إلى أن الأربعة متغيرات التنبؤية هي عبارة 
عن تعقيد غير ضروري. إن إضافة متغيرات تنبؤية لا علاقة لها بالنموذج 
قد تؤدي إلى ارتفاع الأخطاء المعيارية للمتغيرات التنبؤية الأخرى مؤديا إلى 
انخفاض دقة التقديرات لتلك التأثيرات؛ يمكن الحصول على نموذج LSS‏ 
ومختصرء وذلك باستبعاد المتغيرات التنبؤية التي لم تكن ذات معنوية وذلك 

باستبعاد واحد في كل مرة» أولاً سوف نقوم باستبعاد „adfert ill‏ 
.regress life school loggdp chldmort‏ 





























Source MS Number of obs - 178 
F( 3, 174) = 430.79 

Model 15545.2275 3 5181.7425 Prob > F = 0.0000 
Residual 2092.9623 174 12.028519 R-squared - 0.8813 
Adj R-squared = 0.8793 

17638.1898 177 99.6507898 Root MSE - 3.4682 





life Coef. Std. Err. t P»|t| [95$ Conf. Interval 
school -.233002 .1540928 -1.51 0.132 -.5371337 .0711297 
loggdp 4.056047 .808465 5.02 0.000 2.460387 5.651708 
chldmort -.1514263 .008493 -17.83 0.000 -.168189 -.1346637 
-cons 62.22201 3.032798 20.52 0.000 56.2362 68.20782 


«school ثم نقوم باستبعاد متغير‎ 
.regress life loggdp chldmort 
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Source Number of obs - 178 
F( 2, 175) - 640.33 

Model 15517.7253 2 7758.86267 Prob » F = 0.0000 
Residual 2120.46446 175 12.1169398 R-squared = 0.8798 
Adj R-squared = 0.8784 

17638.1898 177 99.6507898 Root MSE = 3.4809 









Coef. Std. Err. (95% Conf. Interval] 









3.510749 . 7262322 2.077448 4.94405 
chldmort -.1457805 . 0076563 -19.04 0.000 -.160891 -.13067 
62.28614 3.043627 20.46 0.000 56.2792 68.29308 


انتهينا بنموذج يحتوي على متغيرين تنبؤيين اثنين» وأخطاء معيارية 
منخفضة. وعملياً فإن dad‏ ۸ المعدلة هي نفسها )0.8784 عند وجود 
متغيرين تنبؤيين» و0.8786 عند وجود أربعة متغيرات) وقيمة مُعَاملات 
المتغير Joggdp‏ أصبحت أقل بنسبة بسيطة» بينما قيمة معاملات المتغير 
Aag ji Anl c ad ee‏ 

0.15chidmort‏ ررم وع 3.5110 + 62.29 = life‏ المتوقع 

يمكننا حساب القيم المتوقعة لأي مجموعة من قيم المتغيرات loggdp‏ 
chidmort 5‏ بواسطة تعويض هذه القيم في معادلة Jas3yl‏ « الأمر margins‏ يقوم 
بحساب المتوسطات المتوقعة (تسمى أيضا المتوسطات المعدلة) للمتغير التابع عند 
قيم معينة لمتغير مستقل واحد أو أكثرء فمثلاً لمعرفة متوسط العمر المتوقع 
Joggdp s‏ المعدلة عندما تكون asi‏ المتغير chidmort‏ هي 12 100« 200. 

emargins, at(chldmort = (2 100 200)) vsquish 


Predictive margins Number of obs = 178 
Model VCE : OLS 

Expression : Linear prediction, predict() 

| BE ed : chldmort = 2 

2. at : chldmorc = 100 

3, at : chldmort = 200 






Delta-method 
Margin Std. Err. 






P>|z| (95% Conf, Interval] 


N 
















75.23421 . 4408642 170.65 0.000 74.37013 76.09828 
60.94772 -4733418 128.76 0.000 60.01998 61.87545 
46.36966 1.189535 38.98 0.000 44.03822 48.70111 
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الا c l Ua‏ 


جدول الأمر margins‏ السابق» يوضح بأن المتوسط المقدّر للعمر 
المتوقع Laie‏ تكون 2 = chldmort‏ خلال جميع القيم المشاهدة للمتغير loggdp‏ 
يساوي 175.23 وبشكل مشابه؛ فإن المتوسط all‏ للعمر المتوقع عندما 
تكون 200 = chidmort‏ يساوي 46.37( وإذا قمنا بإدخال الخيار OM atmeans‏ 
المتغير Ioggdp‏ سوف يساوي قيمة متوسطة معطياً نتائج متساوية في هذا 
المثال» والمخرجات سوف يتم توصيفها بأنها "التوقعات المعدلة" "adjusted‏ 
Ya predictions”‏ من "الهوامش التنبؤية" “predictive margins"‏ . 

يمكننا أن نقوم بحساب المتوسطات المتوقعة عند قيم محددة للمتغيرات 
-loggdp 5 chldmort‏ الأوامر التالية تحسب المتوسطات عند ست مجموعات 
من القيم» عندما يكون المتغير chidmort‏ يساوي 2 أو 100 أو 200 وعندما 
يكون المتغير loggdp‏ يساوي 2.5 أو AS‏ 


margins, at(chldmort = (2 0 200) loggdp - 
(2.5 4.5)) vsquish 


Adjusted predictions Number of obs = 178 
Model VCE : OLS 
Expression : Linear prediction, predict () 
1. at : loggdp = 23.5 
chldmort = 2 
2.846 : loggdp - 2.5 
chldmort = 100 
3% wat : loggdp = 2.5 
chldmort = 200 
4. at : loggdp - 4.5 
chldmort - 2 
LE : loggdp z 4.5 
chldmort = 100 
6._at : loggdp = 4.5 
chldmort = 200 






Delta-method 
Margin Std. Err. z P»|z| [95% Conf. interval] 








a 

1 70.77145 1.244946 56.85 0.000 68.3314 73.2115 
2 56.48496 - 718987 78.56 0.000 55.07577 57.89415 
3 41.90691 - 7896567 53.07 0.000 40.35921 43.45461 
4 77.79295 .4312218 180.40 0.000 76.94777 78.63813 
5 63.50646 . 9082472 69.92 0.000 61.72633 65.28659 
6 48.92841 1.624056 30.13 0.000 45.74532 52.1115 
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الأمر أدناه marginsplot‏ يقوم بإنشاء رسم بياني لنتائج الهوامش 
margins‏ في الشكل (5.7). 
.marginsplot‏ 


Adjusted Predictions with level(95)% Cls 


Linear Prediction 
60 





40 


50 
p 


=. i 
100 200 
Prob dying before age 5/1000 live births 2005/2009 
ما‎ loggdp-2.5 —®— loggdp-4.5 | 


N 


الشكل (5.7) 


للحصول على معاملات الانحدار المعيارية (أو زان بيتا) مع الانحدار 
نقوم بإضافة الخيار cheta‏ المُعاملات المعيارية هي ما يمكن أن نجده في 
الانحذار lade‏ تكون جميع المتغيرات قد تم تحويلها إلى نتائج قياسية والتي 

Maal y وانحرافها المعياري يساوي‎ ia متوسطها الحسابي يساوي‎ 
.regress life loggdp chldmort, beta 















Source 58 df MS Number of obs - 178 
F( 2, 175) = 640.33 

Model 15517.7253 2 7758.86267 Prob > F = 0.0000 
Residual 2120.46446 175 12.1169398 R-squared = 0.8798 
Adj R-squared = 0.8784 

17638.1898 177 99.6507898 Root MSE = 3.4809 










life Coef. Std. Err. P>|t| Beta 


et 


3.510749 .7262322 4.83 0.000 .1974935 
-.1457805 .0076563 -19.04 0.000 -.7778774 
62.28614 3.043627 20.46 0.000 


chldmort 
-cons 
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معادلة الانحدار المعيارية سوّف تكون على الشكل التالي: 
life = 0.197loggdp' - 0.778chldmort’‏ المتوقع 
حيث إن life!‏ و loggdp'‏ و chidmort’‏ تشير إلى أن هذه المتغيرات في شكل 
معياري» Wiad‏ يمكننا تفسير المعامل المعياري للمتغير chldmort‏ كما يلي: 
b; = -0.778‏ يقر بأن العمر المتوقع life‏ ينخفض بمقدار 0.778 
انحراف معياري مع كل زيادة بمقدار 1 في الانحراف المعياري لمعدل 
وفيات الأطفال chidmort‏ إذا لم يتغير الناتج المحلي الإجمالي loggdp‏ 
اختبارات ry F‏ و۸ والخصائص الأخرى للانحدار تبقى كما هي. 
Olli‏ الفرضيات : Hypothesis Tests‏ 
هناك نوعان من اختبارات الفرضيات يظهران في جداول مخرجات 
الأمر cregress‏ الفرضيات تبدأ باعتبار أن المشاهدات الموجودة في العينة 
لدينا تم سحبها عشوائيا وبشكل مستقل من مجتمع كبير وغير محدود. 
1- اختبار 7 الشامل: إحصائية F‏ في أعلى اليمين في جدول الانحدار تقيّم 
فرضية العدم في المجتمع» والمُعَاملات لكل المتغيرات في النموذج 
تساوي Ja‏ 
2- اختبارات ¢ الفردية: وتظهر في العمودين الثالث والرابع في جدول 
«laus xl‏ وتحتوي على اختبارات ¢ لكل مُعامل انحدار على bda‏ وهي 
تقيّم فرضيات العدم في المجتمع التي تفترض بأن المُعاملات لكل متغير 
معين تساوي صفرًا. 
احتمالات اختبار + ذات الحدين» واختبارات الجانب الأول تقوم بقسمة 
بالإضافة إلى أن اختبارات F‏ وء المعيارية يمكن لبرنامج ستاتا حساب 
اختبارات 7 لفرضيات يحددها المستخدم» الأمر test‏ يشير إلى النماذج المناسبة 
الأخيرة مثل anova‏ أو Gregress‏ بالعودة إلى مثالنا السابق الخاص بانحدار 
أربعة متغيرات تنبؤية» بافتراض Lil‏ نريد اختبار فرضية العدم التي تفقترض 
بأن المتغيرين chldmort s adfert‏ (يتم أخذهما بالاعتبار (Les‏ ليس لهما تأثير. 
eregress life. school loggdp adfert chldmort‏ 
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Number of obs - 178 

F( 4, 173) = 321.24 

Prob » F = 0.0000 

R-squared = 0.8813 

Adj R-squared = 0.8786 

Root MSE = 3.4782 

t P>|t] [95$ Conf. Interval] 
.50 0.135 -.5415407 -0735999 
.98 0.000 2.447592 5.658283 
.05 0.961 -.019582 .0186455 
.28 0.000 -.1707163 -.131649 
.99 0.000 56.10722 68.40158 


MS 


df 


4 3886.31395 
173 12.0978845 


177 99.6507898 


-1 


-0 
BLS 
19 


Std. Err. 


- 1558288 
- 8133392 
. 0096839 
. 0098966 
3.114434 
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Source 55 
Model 15545.2558 
Residual 2092.93402 





Total 17638.1898 


life Coef. 
School -.2339704 
loggdp 4.052938 
adfert -.0004683 
chldmort -.1511827 
_cons 62.2544 





.test adfert chldmort 


158.03 


0.0000 


(1) adfert - O 


(2) chldmort 0 


n 


F( 2, 173) 
Prob > F = 


Ley‏ فرضيات العدم الفردية تحدد اتجاهات معاكسة (تأثير chidmort‏ ذو 
معنوية إحصائية أما adfert‏ ليس كذلك) الفرضية مجتمعة التي تفترض بأن 
مُعاملات المتغيرات adfert g chldmort‏ كلاهما يساوي T iua‏ يمكن رفضه 
«(p< 0.00005)‏ تطبيق مثل هذه الاختبارات على مجموعة فرعية من 
المعاملات تعتبر مفيدة عندما يكون لدينا مجموعة من المتغيرات التنبؤية 
Lae NETT.‏ تكزن كقديزات yi if) Olea‏ كين Iia pie‏ 
نتيجة التعدد الخطي -multicollinearity‏ | 

test ja‏ يمكنه تكرار اختبار F‏ الشامل. 
.test school loggdp adfert chldmort‏ 


321.24 
0.0006 


0 


(1) school 
(2) loggdp 
(3) adfert - 
(4) chidmort 


n 
| ooo 


F( 4, 173) 
Prob» F = 
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كما SY pay‏ خو تكرار aL Sa ci) fa‏ الفرفية .فم كلا 
بقصوسن مساق TUN‏ الحسياك على إحضائية UI‏ 
الأمر test‏ وهو يساوي مربع إحصائية + في جدول الانحدار )150( = 225 
وسوف ينتج نفس قيمة P‏ 
.test school‏ 
school = 0‏ )1( 


F( 1, 373) = 2.25 
Prob > F = 0,1351 


تطبيقات الأمر test‏ تعتبر أكثر فائدة عند القيام بأعمال متقدمة (بالرغم 
من أنها عديمة الفائدة بالنسبة للعمر المتوقع في مثالنا هذا) تدضمن التالي: 
1- اختبار ما إذا كان مُعَامل ما يساوي GG‏ معيناً» فمثلاً لاختبار فرضية 
العدم التي تقول gh‏ معامل المتغير school‏ يساوي 1 (0- 8: (Ho‏ نقوم 
بطباعة الأمر: 
-test school = 1‏ 
2- اختبار ما إذا كان مُعَاملان متساويين؛ فمثلاً الأمر أدناه piy‏ فرضية العدم 
-Ho :B2 = B3‏ 
.test loggdp = adfert‏ 
3- أخيراً الأمر test‏ يستطيع agi‏ بعض التعبيرات X5 ell‏ حيث يمكننا 
طلب شيء ما مثل اختبار -Ho B2=(B3+ßB4)/100‏ 
.test school - (loggdp + adfert)/100‏ 
لمزيد من المعلومات والأمثلة حول الأمر test‏ قم بطباعة help test yaY!‏ 


Dummy Variables : أطتغيرات الوهمية‎ 





المتغيرات النوعية يمكن أن تصبح متغيرات تنبؤية في تحليل الانحدار 
عندما يتم التعبير عنها على شكل رقم واحد أو أكثر }0,1{ فهي ثنائيات 
تسمى متغيرات وهمية. فعلى سبيل المثالء كنا قد لاحظنا وجود اختلاف 
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كبير بين مناطق العالم بالنسبة لمتوسط العمر المتوقع (الشكل 1.7(« المتغير 
النوعي region‏ يساوي القيم من 1 (أفريقيا) إلى 5 (الجزر الأستوائية بالمحيط 
الهادي) والتي يمكن sale]‏ التعبير عن قيم هذا المتغير كمجموعة من خمسة 
متغيرات وهمية (0,1)» الأمر tabulate‏ يوفر طريقة تلقائية للقيام بذلك حيث 
يقوم بإنشاء متغير وهمي واحد لكل فئة للمتغيرات المدرجة في الأمر عند 
القيام بإدراج الخيار gen.‏ (إنشاء). في المثال أدناه فإن المتغيرات الوهمية 
التي تم إنشاؤها تم تسميتها pleas‏ من reg]‏ إلى Cu regs‏ إن reg].‏ يساوي 
1 للدول الأفريقية وصفر لبقية الدول» reg?‏ يساوي 1 لدول أمريكا وصفر 
لبقية الدول» وهكذا لبقية المتغيرات. 


.tabulate region, gen(reg) 












Region Freq. Percent Cum. 





Africa 


Americas 35 18.04 44.85 
Asia 49 25.26 70.10 
Europe 43 22.1716 92.27 


Oceania 


Total 194 





.describe reg* 





storage display value 
variable name type format label variable label 
region byte $8.0g region Region 
regi byte $8.0g region--Africa 
reg2 byte $8.0g region--Americas 
reg3 byte $8.0g region--Asia 
reg4 byte $8.0g region==Europe 
reg5 byte $8.0g region--Oceania 


.label values regi regi 
.label define regi 0 "others" 1 "Africa' 
.tabulate regi region 





Region 
Asia 


region--Af 
rica 





Africa Americas 





Europe 








others 
Africa 


Total 
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انحدار المتغير life‏ على متغير وهمي واحد reg]‏ (أفريقيا) هو معادل 
للقيام باختبار ؛ لعينتين اثنتين لمعرفة ما إذا كان متوسط المتغير life‏ هو Audi‏ 
بالنسبة لفئات frog]‏ وهل متوسط العمر المتوقع يختلف اختلافاً معنوياً بالنسبة 

لأفريقيا مقارنة بقارات العالم الأخرى؟ 
.ttest life, by(reg1)‏ 


Two-sample t test with equal variances 





Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval 






























others 
Africa 






142 
52 


73.21115 
56.49038 


6.03951 
8.551912 


.5068244 
1.185937 


74.21311 
58.87125 


72.20919 
54.10952 









combined 194 68.7293 .7219359 10.0554 67.3054 2015 
diff 16.72077 1.101891 14,5474 18.89413 
diff = mean (others) - mean (Africa) t- 15.1746 

Ho: diff = 0 degrees of freedom - 192 
Ha: diff > 0 Ha: diff t= 0 Ha: diff » 0 

Pr(T > t) = 1.0000 Pr(|T| > |t]) = 0.0000 Pr(T > t) = 0.0000 


.regress life regi 






















Source Number of obs - 194 
PI dg 192) = 230.27 

Model 10641.4858 1 10641.4858 Prob » F - 0.0000 
Residual 8872.96636 192 46.2133664 R-squared - 0.5453 
Adj R-squared = 0.5429 

19514.4521 193. 10£$.111151 Root MSE = 6.798 












P>|t| [95% Conf. Interval] 








-16.72077 1.101891 15.17 0.000 -18.89413 -14.5474 
73.21115 570479 128.33 0.000 72.08594 74.33636 


اختبار » يؤكد gh‏ 16.72 سنة اختلاف بين متوسطات أفريقيا 
(56.49) ومناطق العالم الأخرى (73.21) هو اختلاف ذو معنوية إحصائية 
p = 0.000)‏ ,15.17 = ) حصلنا على نفس النتائج من انحدار المتغير الوهمي 
Gus (t= -15.17, p = 0.000)‏ إن regI(b, = -16.72) alain‏ كما أنه يشير إلى 
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أن متوسط العمر المتوقع 16.72 سنة أقل في أفريقيا عنه في مناطق العالم 
الأخرى )73.21 = «(bo‏ 


الشكل )6.7( يوضح بيانياً انحدار المتغير الوهمي؛ كل خيارات البيانات 
تم تمثيلها بخط يمتد عبر مجموعتين أفقيتين عند المتغير 1 = reg]‏ (أفريقيا) 
و0 = reg]‏ (غير ذلك)» لتوضيح هذه النقطة Lily‏ هذا المثال يستخدم الخيار 
jitter(5)‏ والذي يقوم بإضافة pas‏ صغير لكل نقطة في الرسم البياني بحيث 
تظهر على شكل دائرة صغيرة: الخيار 16650 لا يؤثر على خط الانحدار 
وهو يربط hu gia‏ المتغير life‏ عندما تكون (0)73.21 = regl‏ مع متوسط 
المتغير life‏ عندما )0(56.49 = reg]‏ كلا المتوسطين أو القيم المتوقعة يتم 
رسمها باستخدام مربعات Alles‏ الفرق بين المتوسطين يساوي ميل الانحدار 
716.72 سنة» يجب ملاحظة أن القيم 0 و1 للمتغير reg!‏ تم إعادة توصيفها 
بالرسم البياني باستخدام الخيار 125610 بالأمر graph‏ 


.predict lifehat 
graph twoway scatter life lifehat regi, 
msymbol(oh S) jitter(5) 

lfit life regi 

; legend(off) xlabel(0 "others" 1 "Africa") 
xtitle("Global region") ytitle("Life expectancy 
in years") 





Life expectancy in years 





Global region 


الشكل )6.7( 
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NEE ee‏ 


مناطق العالم الخمس تم التعبير عنها بخمسة متغيرات وهميةء ولكن 
ليس من المحتمل أن يتم تضمين كل المتغيرات الخمسة في نموذج انحدار 
asd g‏ بسبب الارتباط الخطي المتعدد multicollinearity‏ وهي أن قيم أي أربعة 
متغيرات من هذه المتغيرات الوهمية لها القدرة على تحديد قيم المتغير 
الخامس» وبالتالي يمكننا تمثيل كل المعلومات للفئة k‏ لمتغير نوعي ما من 
خلال متغيرات وهمية ael‏ فمثلاً وكما رأينا سابقاً بخصوص الناتج المحلي 
الإجمالي لكل فرد (في الشكل اللوغاريتمي (loggdp‏ ومعدل وفيات الأطفال 
les (chidmort)‏ يوضحان حوالي %88 من التباين في العمر المتوقع؛ تضمين 
أربعة متغيرات وهمية لمناطق العالم 4-1 يزيد من هذه النسبة لتصبح حوالي 
«(R’,=0.8872) 9689‏ 
¿regress life reg1 reg2 reg3 reg4 loggdp‏ 





chldmort 
Source 55 df MS Number of obs - 178 
F( 6, 171) = 233.00 
Model 15715.8742 6 2619.31237 Prob > F = 0.0000 
Residual 1922 .31561 171 11.2416118 R-squared = 0.8910 
Adj R-squared = 0.8872 
Total 17638.1898 177 99.6507898 Root MSE = 3.3529 











Coef. Std. Err. P»|t| [95% Conf. Interval] 











regi -2.150794 1.211918 -1.77 0.078 -4.543041 . 7 
reg2 1.486722 1.176501 1.26 0.208 -.8356127 3.809057 
reg3 . 4 1.129945 0.87 0.385 -1.246603 3.21427 
reg4 1.455465 1.199846 1.21 0.227 -.9129513 3.823882 
loggdp 3.239467 . 7342834 4.41 0.000 1.79004 4.688894 
chldmort -.1270253 - 0086971 -14.61 0.000 -.1441928 -.1098578 
-cons 62.16206 3.10137 20.04 0.000 56.04016 68.28396 





كل المتغيرات الوهمية الخاصة بمناطق العالم ليست ذات معنوية 
إحصائية عندما قمنا بإدخالها جميعاً وقمنا بالتحكم loggdp ci a m à‏ 
‘chldmort s‏ المُعَاملات ليست ذات معنوية إحصائية تشير إلى أن Zigi‏ 
أصغر قد يكون أكثر فائدة» ويعطي صورة أكثر i‏ للتأثيرات A agal‏ 
الخطوة الأولى نحو تقليص النموذج تتضمن استبعاد المتغير 63 وهو 
أضعف متغير تنبؤي» النتائج أدناه توضح أنها أفضل (۸,=0.8873) وتعطي 
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7ب لل بي ص ا ا 
تقديرات أكثر دقة (أخطاء معيارية أقل) لتأثير ات المناطق الأخرى؛ مُعَامل 
المتغير OY reg!‏ يظهر ذو معنوية إحصائية. 

.regress life regi reg2 reg4 loggdp chldmort 























Source 55 df MS Number of obs - 178 
F( 5, 172) = 279.84 

Model 15707.3519 5 8 Prob > F = 0.0000 
Residual 1930.83792 172 11.2258018 R-squared = 0.8905 
Adj R-squared = 0.8873 

17638.1898 99.6507898 Root MSE = 3,3505 








Std. Err. P>|t| [95$ Conf. Interval] 





















regi -2.927382 .8199249 -3.57 0.000 -4.545793 -1.308972 
reg2 .6920922 -7419319 0.93 0.352 -.7723717 2.156556 
reg4 - 6487658 .7618415 0.85 0.396 -.8549968 2.152528 
loggdp 3.273944 .7326992 4.47 0.000 1.827705 4.720184 
chidmort -.1269767 .0086908 -14.61 0.000 -.1441311 -.1098224 
-cons 62.82061 3.00561 20.90 0.000 56.88798 68.75324 





الخطوة التالية» استبعاد المتغير ë reg4‏ أخيراً 2 النتائج في gai‏ 
cll jl pue‏ توضح %89 من التباين à‏ في العمر المتوقع (R?,=0.8879)‏ 

ولكن مع ADE‏ متغيرات تنبؤية فقط. 
.regress life regi loggdp chldmort‏ 












Source 55 df MS Number of obs - 178 
F( 3, 174) = 468.34 

Model 15694.5388 3 5231.517293 Prob > F = 0.0000 
Residual 1943.65102 174 11.1704082 R-squared = 0.8898 
Adj R-squared = 0.8879 

17638.1898 177 99.6507898 Root MSE = 3.3422 








p>|t| [95$ Conf. Interval] 

















regl -3.143763 .7901811 -3.98 0.000 -4.703336 -1.584189 
loggdp 3.414611 .6977087 4.88 0.000 2.037549 4.791672 
chldmort -.1277141 .0086406 -14.78 0.000 -.144768 -.1106603 
_cons 62.65707 2.923818 21.43 0.000 56.88636 68.42779 





من هذا التحليل الإحصائيء يمكننا أن نستنتج أن الاختلافات في العمر 
المتوقع بين مناطق العالم المختلفة كانت بسبب التباين في الصحة ومعدل 
وفيات SUEY!‏ ولكن في أفريقيا هناك ظروف أخرى لها Lat‏ (مشل 
الحروب) التي تقلل من العمر المتوقع. 
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القن الا ا و 
الثائيرات التفاعلية : Interaction Effects‏ 


الجزء السابق شرح ما يمكن أن يسمى "المتغيرات الوهمية التقاطعية”, 
لأن مُعَاملاتها تزداد لتؤثر في تقاطع معادلة الانحدار مع المحور العمودي 
مقارنة بين مجموعات 0 و1. هناك استخدام آخر للمتغيرات الوهمية وهي 
إنشاء شرط تفاعلي يسمى "ميل المتغيرات الوهمية" وذلك بضرب المتغير 
الوهمي في قياس المتغير. في هذا الجزء سوف نستمر في أستخدام ملف 
بيانات Nations2.dta‏ ولكن نأخذ في الاعتبار بعض المتغيرات المختلفة» وهي 
انبعاث ثاني أكسيد الكربون لكل فرد «(co2)‏ نسبة axe‏ السكان الذين يعيشون 
في المناطق الحضرية urban)‏ والمتغير الوهمي الرابع reg,‏ الذي يساوي 1 
للدول الأوروبية و0 غير ذلك» lan‏ بتوصيف قيم المتغي ر regd‏ وحساب 
لوغاريتم للمتغير co2‏ بسبب الالتواء cas. gall‏ الكبير. 

.label values reg4 reg4 
¿label define reg4 0 "others" 1 "Europe" 
generate logco2 = logi10(co2) 


label variable logco2 "log10 (per cap CO2)' 
.describe urban reg4 co2 logco2 





Storage display value 
variable name type format label variable label 
urban float %9.0g Percent population urban 2005/2010 
reg4 byte — $8.0g reg4 region==Europe 
co2 float $9.0g Tons of CO2 emitted per cap 2005/2006 
logco2 float %9.0g logi0(per cap CO2) 


نقوم بإنشاء مصطلح تفاعلي أو ميل متغير وهمي يُسمى urb reg4‏ وذلك 
بضرب المتغير الوهمي regd‏ في قياس المتغير curban‏ المتغير الناتج وهو 
urb. reg4‏ يساوي urban‏ للدول الأوروبية وصفر لدول العالم الأخرى. 


¿generate urb reg4 = urban * reg4 
label variable urb reg4 "interaction 
urban*reg4 (Europe)" 


انحدار المتغير logco2?‏ على المتغير urban‏ والمتغير regd‏ وشرط 
التفاعل urb reg4‏ يعطي نموذجا يختبر ما إذا كان تقاطع المحور العمودي y‏ 
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أو الميل المتعلق بالمتغير logeo2‏ على المتغير urban‏ ربما يختدف لدول 
أوروبا عن باقي دول العالم. 


.regress logco2 urban reg4 urb reg4 





Source 55 df MS Number of obs - 185 
E( 3, 181) = 72.86 

Model 55.8882644 3 18.6294215 Prob» F - 0.0000 
Residual 46.2772694 181 .255675521 R-squared - 0.5470 
Adj R-squared = 0.5395 

Total 102.165534 184 .555247466 Root MSE = .50564 
ee 
logco2 Coef. Std. Err. t P-|t| [95$ Conf. Interval] 
urban .0217385 .0017762 12.24 0.000 .0182339 .0252431 
reg4 1.294163 .462044 2.80 0.006 .3824774 2.205848 

urb reg4 -.0133405 .0065573 -2.03 0.043 -.0262791 -.0004019 
cons -.4682452 .1007257 -4.65 0.000 -.6669929 -.2694975 


التأثير التفاعلي ذو معنوية إحصائية )0.043 = م) يشير إلى أن العلاقة 
بين نسبة السكان الذين يعيشون بالمناطق الحضرية urban‏ ولوغاريتم انبعاث 
ثاني أكسيد الكربون 108602 تختلف في الدول الأوروبية عنها في بقية دول 
العالم» التأثير الرئيس للمتغير urban‏ هو تأثير إيجابي (0.0217) ويعني أن 
2 يميل ليكون أعلى في الدول التي يكثر فيها الناس الذين يعيشون في 
المناطق الحضرية» ولكن التأثير التفاعلي سلبي وهذا يعني أن الميل الأعلى 
يكون أقل حدة لدول أوروباء وعليه يمكننا صياغة النموذج أعلاه في معادلتين 
اثنتين هما: 

,reg4=1:‏ أوروبا 


logco2 = -0.4682 + 0.021 7urban + 1.2942(1) — 0.0133urban(1)‏ المتوقع 


—-0.4682 + 1.2942 + (0.0217 — 0.0133)u ban 
=0.826 + 0.0084urban 


reg4=0:‏ , الدول الأخرى 


logco2= -0.4682 + 0.0217urban + 1.2942(0) - 0.0133urban(0?‏ المتوقع 
21 - 0.4682- = 
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٠ e a‏ اين 9 ا و > بے 


بعد إجراء تحليل الانحدار» فإن الأمر predict newvar‏ يقوم بإنشاء متغير 
جديد يتضمن القيم المتوقعة من آخر انحدارء ويمكن إنشاء رسم بياني للقيم 
المتوقعة في هذا المثال لإظهار التأثير التفاعلي بيانياً (شكل 7.7( الخط في 
الجانب الأيسر )0 = (regd‏ من الرسم له ميل 0.0217 وتقاطعه مع المحور 
العمودي LÍ (70,4682 y‏ الخط في الجانب الأيمن من الرسم )1 = (regd‏ له 
ميول أقل حدة (0.0084) ونقطة تقاطع أعلى مع المحور العمودي بر 
)0.826(« النتائج تشير إلى أنه لا توجد دولة أوروبية شهدت انخفاضاً في 
عدد السكان في المناطق الحضرية؛ وانخفاضاً في انبعاث ثاني suo S‏ 
الكربون. 
.predict co2hat‏ 
-graph twoway scatter logco2 urban, msymbol (oh)‏ 


|| connect co2hat urban, msymbo]l (+) 
|| > by(reg4) 


others Europe 





— ب ع‎ —I 
100 0 50 100 


Percent population urban 2005/2010 


° log10(per cap CO2) —+— Fitted values 


Graphs by region==Europe 


الشكل )7.7( 


المتغير ات Cus ivarname, c.varname‏ إن الحر ف الأو ل من اسم متغير 
له إشارة معينة» فالحرف 1 يعني مؤشر (indicator)‏ والحرف c‏ يشير e‏ 
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الاستمرارية (continuous)‏ والتي سبق الإشارة إليها في الفصل (6). هذه 
الحروف تعطي طريقة بديلة لتضمين التفاعلات» الرمز # يحدد detal‏ بين 
متغيرين اثنين» و## التفاعل المشترك والذي يتضمن تلقائياً كل تفاعلات 
المستوى JYI‏ متضمناً هذه المتغيرات» المتغير regd‏ هو عبارة عن متغير 
شر والمتغير urban‏ هو متغير مستمرء» QM‏ نفس النموذج الذي سبق 
Py etd‏ الحصول عليه بواسطة الأمر: 
.regress logco2 c.urban i.reg4 c.urban#i.reg4‏ 
وهذا يكافئ التفاعل العاملي: 


.regress logco2 c.urban##i.reg4 







Source 













Number of obs - 185 

RC 3. 181) = 72.86 

Model 55.8882644 3 18.6294215 Prob > F = 0.0000 
Residual 46.2772694 181 -255675521 R-squared = 0 
Adj R-squared = 0.5395 

102.165534 184 .555247466 Root MSE = .50564 









logco2 Coef. Std. Err. t P»|t| [95$ Conf. interval] 















urban 
l.reg4 


.0217385 .0017762 12.24 0.000 .0182339 .0252431 
1.294163 .462044 2.80 0.006 .3824774 2.205848 


reg4#c.urban 
X -.0133405 0065573 -2.03 0.043 -.0262791 -.0004019 


-.4682452 .1007257 -4.65 0.000 -.6669929 -.2694975 





الأمر margins‏ يفهم cu‏ # أو THE‏ علاقات els‏ نسبة الذين يعيشون 
في المناطق الحضرية في البيانات تتراوح بين 0 إلى 96100( ويمكننا 
إنشاء رسم بياني للعلاقات الفاعلية أو تفت المتوسطات المتوقعة للمتغير 
2 عند عدة مستويات من المتغير urban‏ )10« 0 70 أو 100( 
والمتغير reg4‏ )0 3 1( 


.margins, at(urban = (10(30)100) reg4 = (0 1)) 
vsquish 
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it تج‎ TE. nonu N csl artem 


Adjusted predictions Number of obs = 185 
Model VCE : OLS 
Expression : Linear prediction, predict() 
1._at : urban = 10 
reg4 = 0 
2..at : urban = 10 
reg4 = 1 
3..at : urban = 40 
reg4 = 0 
4. at : urban = 40 
reg4 = 1 
5..at : urban = 70 
reg4 = 0 
6. at : urban z 70 
regi = 1 
7..at : urban = 100 
reg4 = 0 
8._at : urban = 100 
reg4 = i 






Delta-method 
Margin Std. Err. 2 P»|z| [95$ Conf. Interval] 








w 
a 





1 -.2508599 .084864 -2.96 0.003 -.4171903 -.0845296 
2 9098981 -3890654 2.34 0.019 -147344 1.672452 
3 -4012958 -046435 8.64 0.000 -3102849 -4923067 
4 1.161839 -2080449 5.58 0.000 -7540788 1.5696 
5 1.053452 .052811 19.95 0.000 -9499438 1.156959 
6 1.413781 -0831383 17.01 0.000 1.250833 1.576729 
7 1.705607 -0953954 17.88 0.000 1.518636 1.892579 
8 1.665722 -2055716 8.10 0.000 1.262809 2.068635 





الخطوة التالية هي استخدام الأمر marginsplot‏ لرسم هذه المتوسطات» 
لاحظ أنه تم استخدام خيارات مع الأمر twoway‏ لتوصيف تفاصيل الرسم 
البياني» الشكل )8.7( يعرض نفس النموذج الذي يعرضه الشكل )7.7( ولكن 
بتنسيق مختلف يعرض فترات الثقة للمتوسطات المتوقعة بدلا من نقاط 
البيانات» الخيار في الأمر marginsplot‏ يحدد 12 (حرف "إل" ثم رقم 2) e‏ 
عنوان المحور في الجانب الأيسر من الرسم. 


.marginsplot, 12("Log{subscript:10} 
(CO(subscript:2) 


per capita)") xlabel(10(30)100) 
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Adjusted Predictions with level(95)% Cls 


1 1.5 


Linear Prediction 
5 


Log: (CO: per capita) 


0 


T 
10 40 70 100 
Percent population urban 2005/2010 


[—— others —e—— Europe 


الشكل )8.7( 


التأثيرات التفاعلية يمكن أن تتضمن قياسات متغيرين» وهناك À à yh‏ 
تسمى التمركز تساعد في تقليص مشاكل الارتباط المتعدد multicollinearity‏ 
مع حل هذه eile‏ وكوعل d Ss‏ للركيسة ad‏ للتفسير. ركد 
Milla ia cla Dac‏ من tall‏ لك قبل anas‏ شرط Dell‏ کت Ba‏ 
التمركز. ومتغيرات التمركز لها متوسطات تساوي صفرا تقريباً وتكون 
سالبة للقيم الأقل من المتوسط. الأمر أدناه يحسب إصدار التمركز للمتغيرات 
urban, loggdp‏ ويعطيها اسمه urband, loggdp0‏ وشرط التفاعل urb gdp‏ يتم 
تعريفه على أنه ناتج urband‏ ضرب loggdp0‏ 


.summarize urban loggdp 





Variable Obs Mean Std. Dev. Min Max 
urban 194 55.43488 23.4391 10.25 100 
loggdp 179 3.775729 .5632902 2.446848 4.874516 


.generate urban0 = urban - 55.4 

.label variable urban0 "Percent urban, 
centered" 

.generate 1099050 = loggdp - 3.78 
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ee Rc a‏ 


.label variable loggdpo "log10 (GDP per cap), 
centered" 


.generate urb gdp = urbanO0 * loggdpO 
.label variable urb gdp "interaction 
urban0*loggdpO" 


تمركز أكثر دقة يمكن القيام به باستخذام المتوسطات التي يستخرجها 
الأمر -summarize‏ 


.summarize urban 
generate urban00 = urban - r(mean) 


قد نقوم باستبعاد كل المشاهدات التي تحتوي على قيم مفقودة في أي 
متغيرات عند حساب الانحدار قبل الحصول على المتوسط لغرض التمركز. 
حساب انحدار Jogo?‏ على التأثيرات الأساسية المركزية للمتغير 
0 و المتغير urban‏ مع شرط التفاعل urb gdp‏ سوف يوضصح أن 
التأثير التفاعلي سالب وذو معنوية إحصائية. 
¿regress logco2 loggdp0 urbanO0 urb gdp‏ 






Source 














Number of obs - 175 

FC 3, 171) = 371.66 

Model 83.4990753 3 1 Prob» F - 0.0000 
Residual 12.806051 171  .074889187 R-squared = 0.8670 
Adj R-squared = 0.8647 

96.3051263 174 .55347773? Root MSE = 6 





Coef. Std. Err. & P»|t| [95$ Conf. Interval] 





loggdpO 1.116759 .0558107 20.01 0.000 1.006592 1.226925 
urbanO .0024787 .0013689 1.81 0.072 -.0002235 .0051809 
urb, gdp -.0082808 -0017418 -4,75 0.000 -.011719 -.0048425 

_cons .8950411 .0267376 33.47 0.000 .8422628 -9478194 





نفس الانحدار يمكن حسابه ورسمه للمتغيرات المستمرة باس تخدام 
الأوامر التلاثة أدناه (النتائج لن يتم عرضها). 
.regress logco2 c.loggdp0 c.urban0‏ 


c.loggdpOitc.urban0 


margins, at(loggdp0 = (-1.3 1.1) urban0 =( -45 
45)) 


emarginsplot 





310 الإحصاء مع برنامج ستاتا 





التأثيرات الأساسية للانحدار من هذا النوع عند إجراء تمركز للمتغيرات 
التفاعلية يمكن تفسيره كتأثير لكل متغير عندما تكون قيم المتغيرات الأخرى 
عند chu all‏ لذا فإن Jogco2‏ المتوقع يزداد بمقدار 1.12 عند زيادة وحدة 
baal‏ في المتغير Lae Joggdp‏ يكون المتغير urban‏ عند قيمته fia ll‏ 
وبالمثل فإن Jogco2‏ المتوقع يزداد بمقدار بسيط )0.0025( عند زيادة وحدة 
واحدة في المتغير urban‏ عندما يكون المتغير Joggdp‏ عند قيمته المتوسطة؛ 
معامل شرط التفاعل urb. gdp‏ يوضح Ob‏ كل زيادة وحدة واحدة في عدد 
السكان الذين يعيشون في المناطق الحضرية تؤدي ضعف تأثير loggdp‏ على 
2 بمقدار 0.008 كما أن زيادة انبعاث ثاني أكسيد الكربون تزداد 
بزيادة الثروة» ولكن هذه الزيادة هي أقل حدة في المناطق الأكثر تحضراً. 


Robust Estimates of Variance : التقديرات اطوثوقة للثباين‎ 


الأخطاء المعيارية؛ واختبارات الفرضيات التي تصاحب الانحدار العادي 
(مثل الانحدار والتباين) تفترض بأن الأخطاء تتبع التوزيعات المستقلة 
والمتطابقة» وإذا كان هذا الافتراض غير صحيح» فإنه من المحتمل أن 
الأخطاء المعيارية سوف تقلل من أهمية التباين من عينة لأخرى: وتعطى 
فترات ثقة صغيرة وغير واقعية أو احتمالات اختبار منخفضة clap‏ للتعامل 
مع هذه المشكلة والتي تسمى اختلاف التباين heteroskedasticity‏ فإن الأمر 
regress‏ وبعض الأوامر المناسبة الأخرى بها خيار يقوم بتقدير الأخطاء 
المعيارية بدون الاعتماد على فرضيات قوية أو أحيانا ضعيفة للاستقلالية أو 
الاعتماد على أخطاء التوزيع المتماظةء هذا الخيار يستخدم مدخلا تم اشتقاقه 
بشكل مستقل من هوبر ووايت وآخر ين Huber, White and others‏ ويشار إليه 
bis!‏ قنطيرة مقثر التباين. 

للحصول على معلومات أكثر عن هذا الخيار» قم بطباعة الأمر help vee‏ 
option‏ أو انظر vce option.‏ في دلبل المستخدم Stata Reference Manual‏ 
للحصول على تفاصيل تقنية أكثر. 
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لصوب لاسي sra: E.‏ ل ا dao‏ 

الجزء السابق شرح انحدار Jogco2.‏ على ADS‏ متغيرات تنبؤية loggdp(),‏ 
urban()‏ ونتائجها «urb gdp‏ ولتكرار نفس الانحدار ولكن مع أخطاء معيارية 
موثوقة سوف نقوم بإضافة الخيار -vee(robust)‏ 


-regress logco2 109930 urban0 urb gdp, 
vce(robust) 


Linear regression 








Number of obs - 175 
r( 3, 171) = 410.66 
Prob > F = 0.0000 
R-squared = 0.8670 
Root MSE = .27366 
Robust 
logco2 Coef. Std. Err. t P»|t| [95$ Conf. Interval] 












loggdpO 1.116759 .0525277 21.26 0.000 1.013072 1.220445 
urban0 . 0024787 .0013123 1.89 0.061 -.0001116 .005069 
urb gdp -.0082808 .0016976 -4.88 0.000 -.0116317 -.0049298 
-cons . 1 .0271616 32.95 0.000 .8414258 .9486564 





الجوانب التوصيفية للانحدار - المُعَاملات و۸ - تتطابق مع أو بدون 
الأخطاء المعيارية الموثوقة. ومن ناحية أخرى» فإن الأخطاء المعيارية 
الموثوقة نفسها مع فترات الثقة واختبارات + و” تختلف عن نظيراتها غير 
الموثوقة التي رأيناها سابقا. وعموما فإن الاختلافات هنا هي اختلافات 
طفيفة» النتائج الرئيسة في هذا المثال لا تعتمد على افتراض أن الأخطاء 
مستقلة» وذات توزيع متطابق لكل القيم للمتغيرات التنبؤية. 
المنطق الذي تقوم عليه تقديرات الأخطاء المعيارية تم توضيحها في 
دليل المستخدم لبرنامج ستاتا User's Gude‏ وباختصار نترك الهدف التقليدي 
وهو تقدير المعالم الصحيحة للمجتمع (B's)‏ لنموذج ما مثل: 
;€ ¥ يتوق + Yi = Bo‏ 
Ja‏ من ذلك» سوف نقوم بمحاولة تحقيق هدف متواضع وهو تقدير 
التباين من عينة إلى عينة التي قد يوجد في مُعاملات 8 فإذا Lid‏ بسحب 
عينات عشوائية وقمنا بتطبيق OLS‏ بشكل متكرر لحساب قيم b‏ لنموذج مثل: 
Yi = bo + bix; + e‏ 
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نحن لا نفترض أن تقديرات b‏ سوف تقترب من معلمة المجتمع 
الصحيحة؛ وفترات الثقة تم إنشاؤها باستخدام الأخطاء المعيارية Aá gb gall‏ 
وبالتالي نفتقد التفسير التقليدي عند الحصول على احتمال مؤكد (خلال 
المعاينة المتكررة) التي ت تحتوي على ad‏ 8 الصحيحة؛ بدلا من ذلك»ء فإن 
فترات الثقة الموثوقة لها احتمال مؤكد (خلال المعاينة المتكررة) تحتوي على 
قيمة eb‏ والتي تعرف بأنها القيمة التي Ely‏ عليها تقوم العينة b‏ بتقدير 
التقارب. ولذا فإننا نقلل من الاعتماد على فرضية أخطاء التوزيع المتطابقة 
من خلال قبول النتائج العادية. 

الخيار الآخر للتباين الموثو J‏ هو vce(cluster clustervar)‏ الذي يسمح لنا 
بتقليص فرضية الأخطاء المستقلة إلى مستوى محدد وذلك عندما تكون 
الأخطاء مرتبطة مع مجموعات فرعية أو عنقودية من البيانات. فمثلاً في 
البيانات المقطعية رأينا اختلافات جوهرية في التباين بين الدول region‏ في 
المثال السابق» إضافة الخيار vee(cluster region)‏ تؤدي إلى الحصول على 
الأخطاء المعيارية الموثوقة في المجموعات الفرعية للدول sregion‏ 


.regress logco2 loggdp0 0 urb gdp, 
vce(cluster region) 


Linear regression Number of obs - 175 
Pt. 2 4) = 771.01 
Prob > F = 0.0000 
R-squared = 0.8670 
Root MSE = .27366 


(Std. Err. adjusted for 5 clusters in region) 


Robust 
Std. Err. t p»|t] [95$ Conf. Interval] 






logco2 Coef. 









loggdpO 1.116759 .0744462 15.00 0.000 .9100631 1.323454 


urbano .0024787 .0015223 1.63 0.179 -.0017478 .0067052 
urb gdp -.0082808 .0022161 -3.74 0.020 -.0144336 -.0021279 
-cons .8950411 .0726082 12.33 0.000 .6934485 1.096634 


مرة أخرى مُعَاملات الانحدار و۸ متطابقة مع تلك التي كانت في 
النماذج السابقة» ولكن الأخطاء المعيارية وفترات الثقة واختبارات الفرضيات 
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لصن rU‏ ا ا 


تغيرت» الأخطاء المعيارية العنقودية أكبر بشكل ملحوظ من تلك التي كانت 
في النماذج السابقةء وهذا أدى إلى الحصول على إحصائيات + أصغر 
واحتمالات أعلى. استخدام الخيار Sol Gal TT vee(robust)‏ تغيرات طفيفة 
مشيراً إلى عدم وجود مشكلة معينة ومفترضاً أن الأخطاء مسد مستقلة ومتطابقة 
التوزيع في المتغيرات التنبؤية 4 بالنموذ ذجء استخدام الخيار vee(cluster region)‏ 
ced‏ إلى کیرک كييرة عشيرا إلى أن الأخطاء ليست مستقلة أو متطابقة 
التوزيع في المتغير region‏ وهذا ما كنا نعتقده. وبالتالي فإن تقديرات الخيار 
vee(cluster region)‏ معقولة» ويمكن الإفصاح عنها في مكان التقديرات 
الافتراضية إذا US‏ نريد كتابة هذه النتائج في أي بحث. 


Predicted Values and Residuals : القيم أطتوقعة والبواقي‎ 
a hg ال‎ ad 


بعد حساب أي Jasil‏ « فإن الأمر predict‏ يمكنه الحصول ليس على 
القيم المتوقعة فقط وإنما أيضاً على البواقي وإحصائيات حالات ما بعد 
التقدير» وهي الإحصائيات التي لها قيم منفصلة لكل مشاهدة في البيانات. في 
هذا الجزء» سوف ننتقل إلى مثال آخر حول الانحدار البسيط لجليد البحر في 
المناطق القطبية خلال شهر سبتمبر area‏ على السنة d year‏ کف 
البيانات .(Arctic9.dta‏ الانخفاض يميل ليكون في المتوسط 0.076- أو MN.‏ 
0 كم في dall‏ وهذا يشرح نحو %75 من التباين في المنطقة 
القطبية area‏ خلال الفترة من 1979 إلى 2011. 
¿use C:\data\Arctic9.dta, clear‏ 
.describe year area tempN‏ 





storage display value 
variable name type format label variable label 
year int Sty Year 
area float %9.0g Sea ice area, million 42 
tempN float %9.0g Annual air temp anomaly 64N-90N © 


“regress area year 
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Source Number of obs - 33 
F( 1, 31( 99.55 

Model 17.4995305 1 17.4995305 Prob » F - 0.0000 
Residual 5.4491664 31 .175779561 R-squared = 0.7626 
Adj R-squared = 0.7549 

22.9486969 32 .717146777 Root MSE = .41926 















Coef. Std. Err. E p>|t| [95% Conf. Interval] 





-.0764773 .0076648 -9.98 0.000 -.0921098 -.0608447 


-cons 157.4225 15.29154 10.29 0.000 126.2352 188.6098 


يمكننا إنشاء متغير جديد باسم areahat‏ يحتوي على القيم المتوقعة من 

هذا الانحدار» ومتغير آخر es‏ 5 يحتوي على بواقي ما بعد التقدير» 

وذلك باستخدام الأمر predict‏ القيم المتوقعة لها نفس المتوسط الحسابي 

«0)(-1.38e09 = -1.38x10? = صفر‎ hu gia والبواقي لها‎ cy للمتغير الأصلي‎ 

لاحظ بأن استخدام علامة النجمة في الأمر summarize‏ أدناه يعني اس تخدام 
كل المتغيرات التي تبدأ باسم “area”‏ 

.predict areahat 

.label variable areahat "Area predicted from 

year' 

predict areares, resid 

.label variable areares "Residuals, area 


predicted from year' 
.summarize area* 





Variable Obs Mean Std. Dev. Min Max 
area 33 4.850303 .8468452 3.09 6.02 
areahat 33 4.850303 .7395001 3.626667 6.073939 
areares 33 -1.38e-09 .4126578  -.8425758 1.116174 


القيم المتوقعة والبواقي يمكن تحليلها مثل أي متغيرات أخرىء فمكلاً 
يمكننا إجراء اختبار الاعتدال للبواقي للتأكد من فرضية الأخطاء å nuhi‏ 
وفي هذا المثال اختبار الالتواء (sktest)‏ يوضح أن البواقي لا تختلف جوهرياً 
عن التوزيع الطبيعي (0.45 = م) 


.Sktest areares 
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Skewness/Kurtosis tests for Normality 





joint 
Variable Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob»chi2 





areares 33 0.2951 0.5344 1.59 0.4520 


إنشاء رسم بياني للقيم المتوقعة مع السنة year‏ يوضح خط الانخدازر 
(الشكل 9.7). 


-graph twoway connect area areahat year, 
msymbol(O +( 


e1 





T — ESS ee 
1980 1990 2000 2010 
Year 


——®— Sea ice area, million km^2 — ——1—— Area predicted from year 
(9.7) الشكل‎ 


البواقي تتضمن معلومات عن المناطق التي يكون فيها النموذج ضعيفا 
وهذا يساعد في تشخيص وحل مشاكل التحليل. مثل هذا التحليل قد يبدأ 
بترتيب واختبار البواقي. البواقي السالبة تظهر عندما يقوم النموذج بإعطاء 
قيم أكبر للقيم المتوقعة» وهذا يحدث في سنوات معينة» حيث تكون المناطق 
الجليدية أقل من الاتجاه العام للتوقعات. ولبيان السنوات التي بها أقل من 
خمسة بواقي نقوم بطباعة الأمر: 


“sort areares 
.list year area areahat areares in 1/5 
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year area areahat areares 


.932576 .8425758 
.856098 .6160985 
.691553 .4515528 
.626667 .4266666 
.232689 .4226894 


Ub oa 0 OIN م‎ 





ثلاثة من Uil‏ خمسة بواقي حدثت في أحدث خمس سنوات» وهذا يشير 
إلى التقديرات المبالغ فيها حديثا. 
البواقي الموجبة تظهر عندما تكون القيم الفعلية أعلى من القيم المتوقعة. 
وحيث إن البيانات تم ترتيبها بواسطة e‏ ولعرض أعلى خمسة بواقي نقوم 
بإضافة محدد ”5-» 5/1- Lin‏ هذا المحدد يعني خامس رقم من Al‏ مشاهدةء 
وحرف "إل" Ley)‏ أنه ليس رقم 1 وإنما حرف إل) يعني آخر مشاهداتء 
والمحددات 47/51 in -5/-1, in 47/1, in‏ كل منها يمكنه القيام بنفس الوظيفة. 
.list year area areahat areares in -5/1‏ 


year area areahat areares 


29. : 4.92678 .4632196 
30. s .391439 .4685608 
Sd. z .162007 .4979923 
32. : .079735 .600265 
393. . .773826 1.116174 





مرة أخرىء هناك نمط معين؛ حيث إن أعلى بواقي موجبة أو السنوات 
التي يكون Led‏ النموذج الخطي US‏ جليدا من الجليد الذي تم مشاهدته تمت 
خلال فترة التسعينيات وحتى بدايات .2000 وقبل الانتقال إلى تحليلات 
«eal‏ يُفترض أن نعيد ترتيب البيانات» وذلك عن طريق الأمر sort year‏ 
وبذلك تكون البيانات مرتبة حسب التسلسل الزمني. 

الرسومات البيائية للبواقي مع القيم المتوقعة - والتي تسمى عادة الباقي 
مقابل المتناسب - تعتبر أداة تشخيصية مناسبة. الشكل )10.7( يوضح مكل 
هذه الرسومات؛ حيث يوضح الشكل المتغير areares‏ مع المتغير areahat‏ مع 
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الفضل eni. tui ln cand. cuc‏ ا ا ا Sn‏ 


خط أفقي تم رسمه عند نقطة الصفر ومتوسط البواقي؛ لاحقاً في هذا الفصل 
في الشكل (17.7) يعرض طريقة أخرى لرسم مثل هذه الأشكال البيانية. 


¿graph twoway scatter areares areahat, yline(0) 





e 
ed 
S 
S 
E e 
8^] * e. e e © 
5 e 
o 
Bo : e 
$ 2 8 
S * e e 
a 9 e 
$o °° °6 » a 
P 
e ° 
e 
ا‎ in -y st ——r بح‎ 
35 4 5 6 


4.5 5 
Area predicted from year 


الشكل )10.7( 


الأشكال البيانية التي ترسم البواقي مع القيم المتوقعة لاتوضح أي ميول 
OL‏ فهي مثل سرب من النحل الذي يكون أكثر كثافة في المنتصف (انظر 
a Hamilton ids‏ 1992 للحصول على uf‏ أكثر). ولكن هناك ميولاً مرائيا 
واضح في الشكل (10.7) حيث إن التوقعات مرتفعة as‏ في السنوات الأولى؛ 
مما أدى إلى الحصول على بواقي أغلبها سالبة ومنخفضة في المنتشصف» ثم 
بواقي موجبة تميل لتكون مرتفعة جداً في نهاية المدة حيث تعود البواقي سالبة 
مرة cog yal‏ وهذا هو النمط الذي تمت ملاحظته سابقا عند ترتيب البواقي حسب 
حجمها. 

نمط الارتفاع والانخفاض في البواقي أصبح واضحاً في الشكل (11.7)؛ 
حيث إن البواقي مع القيم المتوقعة في الرسم البياني تم وضعهما مع بعضهما 
بواسطة منحنى منخفض. الانحدار يعتبر طريقة مفيدة لاكتشاف نمط التذبذب 
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في البيانات. تم الحديث باختصار عن ذلك في الفصل "3" (الشكل 26.3(« 
وسوف يتم شرحه بتفصيل أكثر في الفصل (8). 
.graph twoway scatter areares areahat‏ 
1owess areares areahat || , yline(0)‏ || 








e LLL — T _ Si. - x, 


4.5 5 
Area predicted from year 
€ Residuals, area predicted from year 





lowess areares areahat 


الشكل )11.7( 


هذا النمط غير الخطي في البواقي» يشير إلى أن النموذج الخطي لم يكن 

متاسباً لهذه البيانات - سوف نعود لهذه النقطة في الجزء القادم - كما Laf‏ 
سنعود إليها مرة أخرى في الفصل (8). 

بعد أي تحليل انحدارء فإن برنامج ستاتا يحفظ المُعاملات وتفاصيل أخرى 

بشكل مؤقتء ولذا فإن b[varname]‏ يشير إلى معامل gea‏ مستقل varname‏ 

بينما b[ cons]‏ يشير إلى معامل cons‏ (عادة التقاطع مع المحور العمودي (y‏ 

.display _b[year] 

-.07647727 


.display . b[ cons] 
157.42247 


بالرغم من أن الأمر predict‏ يسهل عملية احتساب القيم المتوقعة 
والبواقي» فإنه من الممكن تعريف نفس المتغيرات من خلال زوج من أوامر 
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ممع باستخدام معاملات [ ]5» والمتغيرات الناتجة والتي تم تسميتها 
areahatl‏ و areres!‏ أدناه لها نفس خصائص القيم المتوقعة والبواقي الناتجة 
من الأمر CS s predict‏ لأغر اض معينة؛ فإن الأمر generate‏ يعطلي 
المستخدمين مرونة أكثر. 

.generate areahatl = Jb[ cons] + b[yearl*year 


.generate rearesi = area - areahatl 
.summarize area* 








Variable Obs Mean Std. Dev. Min Max 
area 33 4.850303 .8468452 3.09 6.02 
areahat 33 4.850303 7395001 3.626667 6.073939 
areares 33 -1.38e-09 .4126578  -.8425758 1.116174 
areahati 33 4.850303 7395001 3.626667 6.073939 


Other Case Statistics : GS\ الات إحصائية‎ 


الأمر predict‏ يمكنه حساب العديد من الإحصائيات الأخرى المناسبة 
للنماذج» وبعد الأمر predict JLA (anova 3) regress‏ يتضمن التالي (سوف 
يتم التعويض عن أي اسم متغير جديد ب new‏ في هذه الأمثلة). 
predict new‏ القيم المتوقعة للمتغير predict new, xb «y‏ يعني نفس 
الشيء (الإشارة «xb cl‏ قوة قيمة y‏ المتوقعة). 
predict new, resid‏ البواقي. 
predict new, rstandard‏ البو Àl‏ القياسية. 
predict new, rstudent‏ البواقي القياسية التي تقيس : تأثير المشاهدة على 
تقاطع المحور العمودي y‏ 
predict new, stdp‏ الأخطاء المعيارية للمتوسط المتوقع E"‏ 
predict new, staf‏ الأخطاء المعيارية لكل dad‏ فردية متوقعة sy‏ بعضص 
الأحيان تسمى الأخطاء المعيارية للتقدير أو 
الأخطاء المعيارية للتوقع. 
predict new, hat‏ العناصر المحورية لمصفوفة التقدير LAS)‏ أن الأمر 
agi leverage‏ بنفس الوظيفة). 
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predict new, cooksá‏ تأثير مسافة كوك Cooks D‏ والذي يقاس بتأثير 
المشاهدة : في كل المعاملات التي في النموذج (أو 
بشكل مكافئ كل المشاهدات n‏ للقيم المتوقعة (y‏ 
هناك خيارات أكثر يمكنها الحصول على الاحتمالات المتوقعة والقيم 
المتوقعة. وللحصول على قائمة بهذه الخيارات قم بطباعة الأمر -help regress‏ 
لشرح هذه الخيارات» سوف نعود لبيانات الجليد بالقطب الشمالي بملف 
البيانات Aretic9.dta‏ تحليل البواقي في الجزء السابق OU‏ إلى نموذج خطي 
في الشكل )9.7( وهو ليس مناسباً لهذه البيانات. أحد البدائل البسيطة 
«o SV‏ والذي يوصف بأنه الانحدار من الدرجة الثانية» وهو يتضمن تحليل 
انحدار المتغير التابع على year‏ ومربع year‏ ويمكننا أن fau‏ ذلك بإنشاء 
متغير جديد يساوي مربع year‏ 


.generate year2 - year^2 
.regress area year year2 





Source SS df MS Number of obs - 33 
F( 2, 30) = 67.73 

Model 18.7878137 2 9.39390686 Prob > F = 0.0000 
Residual 4.16088316 30 .138696105 R-squared = 0.8187 
Adj R-squared = 0.8066 

Total 22.9486969 32 .717146777 Root MSE = .37242 
area Coef. Std. Err. t P»|t| [95$ Conf. Interval] 
year 9.658356 3.194155 3.02 0.005 3.135022 16.18169 
year2 -.0024398 .0008005 -3.05 0.005 -.0040747 -.0008049 
cons -9552.853 3186.119 -3.00 0.005 -16059.78 -3045.931 





الانحدار من الدرجة الثانية يعرض تحسناً عاماً في تناسب R^-0.8066‏ 
بالمقارنة مع 0.7549 للانحدار الخطي. وعلى كل ele‏ فإن التحسن هو 
تحسن ذو معنوية إحصائية» كما يشير إلى ذلك معامل المتغير 
.year(p=0.005)‏ الرسم البياني في الشكل )12.7( يعرض هذا التحسن. 
والنموذج من الدرجة الثانية ليس مرتفعا بشكل مستمرء حيث ay‏ أعلى ثم JÍ‏ 
من الجليد المتوقع» كما حدث في النموذج الخطي السابق. 


.predict areahat2 








الفصل السابع : تحليل الانحدار الخطي 321 


.label variable areahat2 "quadratic prediction' 
.graph twoway connect area areahat2 year, 
msymbol(Oh d) 








a aa p Kore 
1980 1990 2000 2010 
Year 


—*— Sea ice area, million km^2 |©—*— quadratic prediction 


الشكل )12.7( 


هناك بديلان للقيام بنفس الانحدار من الدرجة الثانية» فبدون القيام بإنشاء, 
متغير جديد للجذر التربيعي لمتغير «معبريمكننا استخدام الرمز التفاعلي 
ببرنامج ستاتا (#). الأوامر الثلاثة أدناه تقوم بتقدير نفس النموذج. سوف 
نحتاج للرمز # بعد الأمر margins‏ للقيام بالمهمة بالطريقة المطلوبة. 


.regress area year 322 
.regress area year c.yearliic.year 
.regress area c.year#tic.year 


بالرغم من التحسن الواضح في الشكل )12.7(« فإن الانحدار من 
الدرجة الثانية يمكنه أن ينتج أو يزيد من نفس المشاكل الإحصائية؛ ومن 
الأمثلة على هذه المشاكل: القدرة على التأثيرء والذي يعني التأثير المحتمل 
للمشاهدات التي بها قيم استثنائية» والتي يمكن الحصول عليها باستخدام الأمر 

leverage e في هذا المثال» قمنا بتسمية مقياس التأثير‎ - predict 
.predict leverage, hat 
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هذه المرة الشكل يجعل رموز الربط تظهر متناسبة مع قوة التأثير» وذلك بتحديد 
الأو زان التحليلية «[aw-leverage]‏ كما أن الشكل يضع منحنى متوسط (mspline)‏ 
يربط القيم المتوقعة areahat2‏ هذا المنحنى في العادة يُعد أفضل من الخط أو 
الخط المتصل لتوضيح العلاقات في الرسم البياني» لذا فهو يساعد في تحديد رقم 
أكبر للنطاقات في الرسم البياني. وللحصول على مزيد من المعلومات عن أنواع 
الرسم البياني twoway‏ قم بطباعة الأمر -help twoway mspline‏ 

.graph twoway connect area year [aw=leverage], 
msymbol (Oh) 

|| mspline areahat2 year, bands (50) 

lwidth (medthick) 

|| ,note("Data points area proportional to 
leverage") 

legend(off) xline(1980 1996) 
xlabel(1980(5)2010, grid) 

xtitle("") 


ytitle("Sea ice area, million 
km{superscript:2}") 


الشكل )13.7( يعرض منحنى الانحدار من الدرجة التانية مرة es asaf‏ 


5 "m 2 
Sea ice area, million km 











T [JY T— — p T 
1980 1985 1990 1995 2000 2005 2010 


Data points area proportional to leverage 


الشكل )43.7( 
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الرموز في الشكل )13.7( تكون أكبر حجماً للسنة الأولى والسنة 
GY 3539)‏ هذه السنوات لها تأثيرات أعلى» والانحدار من الدرجة الثانية 
يميل ليؤكد على أهمية قيم × المتطرفة (حتى ولو قمنا بتربيع هذه القيم» فإنها 
تظل متطرفة) لذا فإن النموذج يحاول تتبع هذه القيم» Lay‏ كيف أن المنحنى 
يتناسب مع السنة الأولى والسنة الأخيرة. 

القدرة على التأثير تعكس احتمالية التأثير. والإحصائیات الأخرى تقيس 
التأثير بشكل مباشر. أحد إحصائيات هذا التأثير هو «DFBETAS‏ والتي تشير 
بطريقة ما إلى مُعاملات الأخطاء المعيارية للمتغير 1× سوف تتغير إذا تم 
PE NN POETE TRUE EI ET‏ 
ولخد من خلال الأمز «predict new,dfbeta(xvarname)‏ قيم JS! DFBETAS‏ 
المتغيرات التنبؤية في النموذج يمكن الحصول عليها بسهولة عن طريق 
الأمر 340648 والذي يقوم بإنشاء متغير جديد لكل متغير تنبؤي. وفي مثالنا 
هناك متغيران تنبؤيان هما year, year2‏ وبالتالي فإن الأمر dfbeta‏ يعرف 
إحصائيات مؤثرة جديدة واحدة لكل متغير تنبؤي. 


.d£beta 
.describe _dfbeta* 
Storage display value 
varieble name type format label variable label 
.dfbeta i float %9.0g Dfbeta year 
.üfbeta 2 float %9.0g Dfbeta c.year#c.year 


. summarize _dfbeta* 


storage display value 
variable name type format label variable label 
.dfbeta 1 float %9.0g Dfbeta year 
.dfbeta 2 float %9.0g Dfbeta year2 


. summarize _dfbeta* 


Variable Obs Mean Std. Dev. Min Max 





—dfbeta 1 33 .0007181 .1702339  -.3360457 . 550404 
_dfbeta_2 33 -.0007234 .1702921 7.550294 . 6 
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رسم الصندوق في الشكل )14.7( يوضح توزيعات متغيرات 
5 مع قيم متطرفة تم تسميتها year eal‏ 


.graph box | dfbeta*, marker(1, mlabel(year)) 
marker(2, mlabel(year)) 









ا 


AE 


1 
NAE 


Mo 









Dfbeta year EIT] Dfbeta year2 


الشكل )14.7( 


قيم المتغير _dfbeta_I‏ تقوم بقياس تأثير كل مشاهدة على معامل المتغير 
oear‏ سنة 1996 (والتي تعرض قيمة مرتفعة في الشكل 13.7( وهي التي 
استحوذت على أغلب التأثير في معامل السنة ear‏ قيمة المتغير 
díbeta 10.55‏ .0.55 توضح ob‏ معامل المتغير year‏ في الانحدار للعينة 
بالكامل أن حوالي 0.55 من الأخطاء المعيارية أعلى من المفترض في حالة 
لو ما قمنا بإعادة تقدير النموذج مع استبعاد سنة 1996. وبالمثل فإن القيم 
السالبة لسنة 1980 وهي 0.336-—1 dfbeta‏ في معامل المتغير year‏ تشير 
إلى أن حوالي 0.336 من الأخطاء المعيارية أقل من المفترض في حالة لو 
ما قمنا بإعادة تقدير النموذج مع استبعاد سنة 1980( Laing‏ كان معامل year‏ 
(lel‏ من المفترض في سنة 1996« إلا أن معامل JÉ year?‏ بمقدار مشابهء 
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cee E eee‏ 


والعكس قابل للتطبيق في سنة £1980 في البيانات الأصلية (الشكل 13.7( لم 
تكن سنة 1980 rads oe‏ ایا تن أكشر 
تأثيراً من السنوات الأخرى التي تأثيرها أقل 

إذا لم نكن متأكدين من كيفية قراءة DFBETAS‏ يمكننا تأكيد تفسيرنا لهذه 
القيم من خلال إعادة تحليل الانحدار مع استبعاد القيم المؤثرة. ولتوفير 
مساحة» فإن الأمر quietly‏ هنا يقوم بالتأكيد على مخرجات الانحدارء 
ويعرض فقط مُعاملات year piil‏ والمتغير Lagin g year?‏ مسافات خالية 
حتى نتمكن من قراءتها بوضوح. تحليل الانحدار الأول يستخدم العينة 
بالكامل» Gas‏ تحليل الانحدار الثاني يستبعد سنة 41996 والتي كان بها 
معامل المتغير year‏ أقل (من 8 إلى 8.067( (aua‏ المتغير year2‏ 
أعلى (من 0.0024- إلى 70.0020( إن عملية استبعاد سنة 1980 في 
تحليل الانحدار الثالث لها تأثير معاكس» حيث إن معامل المتغير year‏ أصبح 
أعلى (من 8 إلى 10.730( ومعامل المتغير year?‏ أصبح أقل (من 
0.0024- إلى 0.0027). 


. quietly regress area year year2 

. display _blyear] " " _b[year2] 

9.6583565 -.00243981 

.quietly regress area year year2 if year!=1996 
.display _b[year] " " _b[year2] 

8.0666424 -.00204096 

-Quietly regress area year year2 if year!=1980 
.display _b[year] " " _b[year2] 

10.730059 -.00270786 


إذا قمنا باستخدام # لإدخال شرط تربيع» فإن آخر od‏ سوف يكون 


كما يلي: 
.quietly regress area year c.yeartc.year if‏ 
year!-1980‏ 
.display _b[year} " " _b[c.year#c.year]‏ 
00270786.- 10.730059 


التأثير أو 285881745 أو أي إحصائيات أخرى يمكن استخدامها مباشرة 
لاسبتعاد مشاهدات من أي تحليل» فمثلاً أول أمرين من الأوامر أدتاه تقوم 
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بحساب مسافة كوك Cook's D‏ وهي إحصائية تقوم بقياس تأثير كل مشاهدة 
على النموذج ككل بدلا من المُعاملات الفردية كما يحدث في 2278781485 
الأمر الثالث من الأوامر أدناه يكر ر تحليل الانحدار الأولي باس تخدام 
المشاهدات التي ظهرت في مسافة كوك فقط وهي Ji‏ من 0.10 


.regress area year year2 
.predict D, cooksd 
.regress area year year2 if D« .10 


باستخدام أي تعريف ثابت عن سبب ظهور القيم المتطرفة لأنهمن 
الممكن أن نرى الكثير منها في العينات الأكبر حجماًء لهذا السبب فإن تحديد 
أحجام العينات أمر مرغوب فيه لتحديد المشاهدات الاستثتائية» وبعد تحديد 
نموذج الانحدار المناسب مع مُعَاملات × (هذا يتضمن تحديد المعامل 
الثابت). Sly‏ على عدد المشاهدات n‏ يمكننا فحص هذه المشاهدات لمعرفة أي 
من الشروط أدناه صحيح: 
leverage h > 2K/n‏ التأثير 


Cook's D> 4/n‏ مسافة كوك 


coUa DFITS>2 I:‏ المناسبة 


Welsch’s W3VK 
DFBETA>2/ 4n 
|COVRATIO — \|2 3K/n 


سبب اختيار الحدودء وإحصائيات التشخيص أعلاه» يمكن الحصول Lele‏ 
من دراسات Cook and Weisberg(1982, 1980) Belsley, Kuh and‏ )1982 ,1994( 
Fox 3 Welsch‏ )1991( 


تنشخيص الارنباط اطتعدد واخنلاف النباين : 
Diagnosing Multicollinearity and Heteroskedasticity‏ 
الارتباط المتعدد يشير إلى مشكلة العلاقات الخطية القوية كيدا بين 


المتغيرات التنبؤية أو المتغيرات المستقلة في النموذج. I3‏ وجدت Lots)‏ 
متعددًا كاملا بين المتغيرات sil‏ 644 فإن معادلة الانحدار سوف تفتقر الي 
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الحلول المطلوبة. برنامج ستاتا يحذرناء ثم يقوم باستبعاد المتغير التنبؤي 
الذي يسبب المشكلة. وفي حالة وجود ارتباط متعدد مرتفع وليس كاملاء فإن 
هذا يؤدي إلى مشاكل طفيفة جداً. وإذا قمنا بإضافة متغير تنبؤي جديد له 
علاقة قوية مع المتغيرات التنبؤية اود سنا تي odi‏ فإن ذلك 
سوف يؤدي إلى ظهور أعراض لمشاكل أخرى منها ما يلي: 

- أخطاء معيارية مرتفعة بشكل جوهري مع إحصائيات t‏ منخفضة. 

- تغير غير متوقع في مقدار المُعاملات أو إشاراتها. 

- مُعَاملات غير جوهرية بالرغم من وجود R?‏ مرتفعة 

الانحدار المتعدد يحاول تقدير التأثيرات المستقلة لكل متغير ×» وهناك 
معلومات ALIS‏ للقيام بذلك إذا كان واحد أو ASÍ‏ من المتغيرات × ليس لها 
تباين مستقل» الأعراض التي تم ذكرها أعلاه هي عبارة عن تحذير بأن 

تقديرات المُعاملات أصبحت غير موثوقة» وربما تغيرت بشكل كبير مع 
تغييرات طفيفة في البيانات أو النموذج نفسه. هناك حاجة إلى المزيد من 
استكشاف الأخطاءء ومحاول تشخيصها لتحديد ما إذا كان الارتباط المتعدد 
مشكلة حقيقية. وإذا كانت كذلك فماذا يجب أن يتم فعله حيالها؟ 

مصفوفات الارتباط في العادة تعتبر كمؤشر تشخيصيء ولكن لها حدود 
معينة لاكتشاف الارتباط الخطي المتعدد. الارتباطات يمكنها اكتشاف 
الارتباط الخطي أو العلاقات الخطية بين زوج من المتغيرات. ومن ناحية 
أخرىء فإن الارتباط المتعدد يتضمن علاقات خطية بين مجموعة من 
المتغيرات المستقلة» والتي قد لاتكون واضحة من الارتباطات. التشخيص 
المناسب يتوفر من خلال الأمر estat vif,‏ لتضخم التباين. 

eregress area year year2 












Source MS Number of obs = 33 
F( 2, 30) = 67.73 

Model 18.7878137 2 6 Prob > F = 0.0000 
Residual 4.16088316 30 .138696105 R-squared = 0.8187 
Adj R-squared = 0.8066 

22.9486969 32 5-7 Root MSE = .37242 

area Coef. Std. Err. £ P>|t| [95% Conf. Interval 
year 9.658356 3.194155 3.02 0.005 3.135022 16.18169 
„year2 -.0024398 .0008005 -3.05 0.005 -.0040747 ~-.0008049 
-cons -9552.858 3186.119 -3.00 0.005 -16059.78 -3045.931 
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.estat vif 


Variable 






VIF 1/VIF 








220094.55 0.000005 
220094.55 0.000005 


year 





220094.55 

العمود 1/915 في اليمين بالجدول أعلاه؛ يعطي Led‏ تساوي R‏ -1 من 
انحدار كل متغير × على المتغيرات الأخرى ×. ففي مثالنا عن الجليد في 
القطب الشمالي» تمثل Alla‏ شاذةء حيث إن 0.000005 - وهي أقل من 
5 في المائة لتباين متغير year‏ هي مستقلة عن المتغير المستقل year‏ 
والعكس. كما أن عامل تضخم التباين أو قيم VIF‏ نفسها مع المتغيرين 
التنبؤيين في النموذج يوضح أن التباين في مُعاملاتها أعلى من المفقرض 
بحوالي 220000 مرة» الأخطاء المعيارية å year iial‏ النموذج الخطلي 
البسيط الذي رأيناه سابقاً في هذا dail‏ تساوي 0.0076648 Lhal y‏ 
المعياري المقابل في النموذج من الدرجة الثانية أعلاه أعلى بمرات عديدة من 
5 :. 

قيم VIF‏ تشير إلى وجود ارتباط خطي خطيرء وحيث إنه يوجد لدينا 
متغيران تنبؤيان في هذا المثال» فإننا نستطيع تأكيد ذلك من خلال النظر إلى 
الارتباطات. النتائج olif‏ تظهر gh‏ المتغيرين year, year?‏ مرتبطان بشكل كامل. 


.Correlate area year year2 


Mean VIF 





(obs=33) 


area year year2 





year -0.8732 1.0000 
year2 -0.8737 1.0000 1.0000 


bs YI‏ الخطي أو الارتباط الخطي المتعددء يمكن أن يحدث في أي نوع 
من النماذج» ولكنهما أكثر انتشارا في النماذج التي تكون oa Led‏ 
المتغيرات التنبؤية واضحة عن الأخرىء مثل نماذج التأثيرات التفاعلية أو 
نماذج الانحدار من الدرجة الثانية. الحل البسيط وهو التمركز- الذي Cid‏ 
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الإشارة إليه سابقاً في شروط elit‏ - يمكنه laf‏ أن يساعد في الانحذار 
من الدرجة الثانية» لتقليل الارتباط الخطي المتعددء فإن التمركز في العادة هو 
«Jal‏ حيث إنه gi‏ معاملات أكثر دقة مع أخطاء معيارية منخفضة. 

يمكننا القيام بالتمركز من خلال طرح المتوسط من أحد متغيرات + قبل 
حساب الثاني» متوسط السنة year‏ في هذه البيانات هو 1995» والتمركز لهذا 
المتغير يسمى yearü‏ ويمثل السنوات قبل 1995 (سالب) أو ما بعد سنة 
1995 (موجب)» المتغير yearü‏ المتمركز له hu gia‏ صفرء والمتغير الثاني 
الجديد year02.‏ يساوي مربع yeard‏ وقيمه تتراوح ما بين 256 Laie)‏ 
«year(0—-16(; SS‏ وهذا يعني 1979( إلى صفر (عندما 0 = yearü‏ وهذا يعني 
ages e (1995‏ من aus‏ ليكون 256 yearü = +16 Laie)‏ وهذا يعني 
2011( 


.gen year0O = year - 1995 
gen year02 = year0 ^2 
.Summarize year year0 year02 






Variable Obs Mean Std. Dev. Min 









33 1995 9.66954 1979 2011 
33 0 9.66954 -16 16 
33 90.66567 82.23847 0 256 


year 
year0 
year02 


بعد التمركز سوف تتضح لدينا الفروقات في معامل المتغير المتمركز 
والخطأ المعياري» ولمشاهدة هذا سوف نقوم بتحليل انحدار ada‏ البحر area‏ 
على المتغير year)‏ والمتغير year02‏ النتائج تشير إلى أن ”8 واختبار ‏ هي 
بالضبط نفس النتائج التي أظهرها تحليل انحدار area‏ على المتغيرات التي لم 
يتم إجراء تمركز لها وهي LS year, year2‏ أن القيم المتوقعة والبواقي 
استمرت كما هي. أما في نتائج المتغيرات المتمركزة فإن الأخطاء المعيارية 
للمتغير JÍ year‏ بكثير» » وفترات الثقة أصبحت tana‏ وإحصائيات + أكبر» 
وبواقي اختبار : أصبحت GIS‏ معنوية أكبر مما كانت عليه في تحليك | 
الانحدار غير المتمركز مع متغير year‏ الأصلية. 


.regress area year0 year02 
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: ١ 














Source | SS d£ MS Number of obs - 33 
F( 2, 30) = 67.73 

Model 18.7878137 2 9.39390686 Prob » F = 0.0000 
Residual 4.16088316 30 .138696105 R-squared = 0.8187 
Adj R-squared = 0.8066 

22.9486969 32 .717146777 Root MSE = .37242 

area Coef. Std. Err. t p»|t] [95$ Conf. Interval] 
year0 -.0764773 .0068085 -11.23 0.000 -.0903821 -.0625725 
year02 -.0024398 .0008005 -3.05 0.005 -.0040747 -.0008049 
cons 5.071512 .0973195 52.11 0.000 4.872759 5.270265 





بالرغم من B‏ المتغير year‏ والمتغير year?‏ مرتبطان بالكامل» فإن 
ارتباطهما بعد التمركز أصبح أقرب للصفر. 


.correlate year0 22 
(obs=33) 


year0 year02 





yearÜ 1.0000 
year02 -0.0000 1.0000 


OY‏ المتغيرين التنبؤيين غير مرتبطين ولم يحدث هناك تضخم للتباين. 


.estat vif 






Variable 





1.00 1.000000 
1.00 1.000000 


year0 
year02 


أن الأمر estat‏ يقوم بحساب إحصائيات تشخيصية أخرى مفيدة 
فمثلاً estat hettest‏ يقوم باختبار اختلاف التباين لافتراض تباين Lhal‏ 
المستمرء حيث يقوم بذلك من خلال اختبار ما إذا كانت البواقي المعيارية 
المربعة ترتبط ارتباطاً Gha‏ بالقيم المتوقعة (انظر دراسة Cook and‏ 
8 لمزيد من الأمثلة والشرح). وکما هو موضح أدناه فإن o‏ 
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Y estat hettest‏ يعطي (m‏ لرفض فرضية العدم التي تقول بثبات التباين؛ 
حيث إن النتائج لاتوضح أن اختلاف التباين ذو معنوية إحصائية. 
.estat hottest‏ 
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity‏ 
Ho: Constant variance‏ 


Variables: fitted values of area 


chi2(1) = 0.00 
Prob > chi2 = 0.9802 


ومن ناحية أخرىء فإن وجود اختلاف تباين ذو معنوية إحصائية يعني 
أن الأخطاء المعيارية يمكن أن تكون متحيّزةء وبالتالي فإن نتائج اختبار 
الفرضيات تكون غير صالحة. 


: البسيط‎ ysl 3 aail نطاقات‎ 
Confidence Bands in Simple Regression 


هذا الجزء يشرح بعض الرسومات البيانية الإضافية التي تساعد في 
العرض المرئي لنماذج الانحدار أو تشخيص المشاكل المحتملةء بالعودة إلى 
ملف البيانات cArctic9.dta‏ نجد أن المتغير tempN‏ يوضح متوسط القيم غير 
العادية السنوية لدرجة حرارة الهواء للمنطقة الشمالية بالكامل من 64 إلى 
90 درجة شمالاً (من سجلات Cle pal Lal AUS,‏ حرارة glas el ali‏ 
البحر)» القيم غير العادية في درجات الحرارة تمثل الاختلافات بالدرجات 
المئوية خلال الفترة من 1980-1951 القيم غير العادية الموجبة هي قيم 
أعلى من متوسط درجات الحرارة خلال الفترة 1980-1951. 

سبق Ud Gly U‏ هذه المناطق ومداها وحجمها في جليد المناطق 
الشمالية (خصوصاً في شهر سبتمبر) شهدت انخفاضاً خلال الفترة 1979- 
1 وهي فترة المراقبة بالأقمار الصناعية. وليس elis‏ بأن درجات 
حرارة هواء سطح البحر شهدت ارتفاعاً خلال نفس المدة بالرغم من أن هذا 
ليس السبب الوحيد في انخفاض الجليد. الميل في ارتفاع درجات الحرارة 
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ala‏ بمقدار حوالي 0.058 درجة مئوية في السنة أو 0.58 في العقد (عشر 
سنوات)» وهو معدل أسرع من معدل الارتفاع العالمي ككل. وللمقارنة» فإن 
بيانات ناسا - لم يتم عرضها هنا - تشير إلى أن الميل في ارتفاع درجات 
الحرارة كان بمعدل 6 درجة مئوية خلال هذه السنوات. 


.regress tempN year 





























Source Number of obs - 33 
Fi 1, 31) = 51.64 

Model 10.2449886 1 10.2449886 Prob > F = 0.0000 
Residual 6.15050844 31 .198403498 R-squared - 0.6249 
Adj R-squared = 0.6128 

16.395497 32 .512359282 Root MSE = .44543 

tempN Coef. Std. Err. t P»|t| [95$ Conf. Intervall 
year .058516 .0081432 17:19 0.000 .C419079 .0751242 
-cons -115.9492 16.24582 -7,14 0.000 -149.0828 -82.81563 





الشكل (15.7) يوضح الميل نحو الارتفاع في القيم غير العادية لدرجات 
الحرارة في المنطقة القطبية الشمالية» درجات الحرارة الواقعية تم تمثيلها في 
الرسم البياني ووضعها على خط الانحدار مع فترة ثقة 7695 للمتوسط 
الشرطي الذي تم تحديده بواسطة الأمر .twoway Ifitci, stdp‏ الخيارات 
الأخرى تقوم بتحديد سُمك خط الانحدار ليكون متوسط dall‏ ويكون عنوان 
الرسم مكتوبا بنص ذي حجم متوسط. كما تم استخدام رمز درجة مئوية وهو 
الرمز ASCII‏ رقم 186 e‏ إدراجه في عنوان المحور العمودي (انظر الشكل 
"16.3" في الفصل "3" لمعرفة الرموز الأخرى في (ASCI‏ 

.graph twoway lfitci tempN year, stdp 

lwidth(medthick) 

|| connect tempN year, msymbol (Th) 

|| , ytitle("Annual temperature 

anomaly, ` =char (186) 'C") 

legend(off) xlabel(1980(5)2010) yline(0) 

title("Arctic temperature trend with 95% c.i. 


for 
conditional mean", size(medlarge)) 
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A NY O RM‏ ا ا dans PCI‏ 


Arctic temperature trend with 9596 c.i. for conditional mean 


5 1 1.5 2 


Annual temperature anomaly,°C 
0 





wo 
i e. ع وج كه‎ Pau 2 ee T ye 
1980 1985 1990 1995 2000 2005 2010 
Year 
(15.7) الشكل‎ 


العديد من القيم السنوية تقع خارج فترات الثقة في الشكل )15.7( مما 
يؤكد حقيقة أن هذه الفترات تشير إلى قيم المتوسط الشرطية أو الميل نفسه 
بدلاً من التوقعات الفردية. فلو افترضنا أننا نريد الحصول على توقع فردي 
لسنة 2012 وإيجاد فترة الثقة المناسبة لهذا التوقع» فإحدي الطرق للقيام بذلك 
هي استخدام محرر البيانات Data Editor‏ لإضافة 34 صفا ina‏ من البيانات. 
وتحتوي هذه البيانات على قيم سنة 2012 أو يمكن القيام بذلك من خلال 
الأمرين أدناه: 


¿set obs 34 
.replace year - 2012 in 34 


ثم قم بتكرار الانحدار للحصول على القيم المتوقعة» والأخطاء المعيارية 
للتوقعات (staf)‏ القيم التي تقع أعلى أو أدنى من حدود الثقة %95 هي القيم 
المتوقعة 5 تقريباً ناقص A‏ زائد مرتين الخطأ المعياري للتوقعات: tempNhat‏ 


.tempNse*2 ناقص أو زائد‎ 
epredict tempNhat 
.label variable tempNhat "Predicted temperature' 
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"Standard error of 


- 2*tempNse 
"lower confidence limit' 
+ 2*tempNse 
"upper confidence limit" 


.predict tempNse, stdf 
.label variable tempNse 
forecast' 

gen tempNlo = tempNhat 
.label variable tempNlo 
.gen tempNhi tempNhat 
.label variable tempNhi 


.list year tempN* in -5/1 
















year tempi tempNhat tempNse tempNlo tempNhi 















30. 1.551012 .4643515 .6223085 2.479715 
32. 2009 1.29 1.609528 .4662754 .6769768 2.542078 
32. 2010 2.11 1.668044 .468333 #7313977 2.60471 
33. 2011 2:22 1.72656 -4705225 .7855148 2.667605 
34. 2012 1.785076 .4728422 


2.73076 ^ 8393915. 
يمكننا الآن إنشاء رسم بياني لقيم المتغيرات tempNlo‏ و tempNhi‏ في 
منطقة المدى (twoway rarea)‏ ورؤوس (rspike) ånde‏ ورؤوس مدببة مغطاة 
(reap)‏ أو رسم alia (ila‏ لعرض فترات الثقةء الشكل )16.7( يتبني نفس 
الطريقة» ويستخدم الأمر )2012 twoway Ifitci, stdf range(1979‏ ثم نقوم 
بوضع خط متصل (connect)‏ فوق رسم بياني لدرجات الحرارة التي تم 
رصدها خلال الفترة 1979 - 2011 حيث تم تمثيلها بمثلشات مجوفة 
(masymbol(Th))‏ وشكل انتشار لدرجات الحرارة المتوقعة لسنة 2012 فق ط 
مع علامة مربع (msymbol(S))‏ وتم إضافة نص يوضح القيم المتوقعة 
الرقمية» وحدود 4&3 Aiud temp Nhat, tempNlo, tempNhi)‏ 2012 تم نسخها 
من الجدول أعلاه) ويجب ملاحظة أن حدود فترة الثقة stdf‏ ,184 واسعة بما 
فيه الكفاية لتكون بمستوى 9695 للمشاهدات؛» وليست مثل فترات الثقة التي 
كانت في الشكل )15.7( -Mit,stdp‏ 


.graph twoway lfitci tempN year, stdf 
lwidth (medthick) 
range(1979 2012) 
connect tempN year, msymbol (Th) 
scatter tempNhat year if year--2012, 
msymbol (S) 
|| . ytitle("Annual temperature 
anomaly, ` =char (186) 'C") 
legend(off) xlabel(1980(5)2010) yline(0) 
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text(2.8 2007 "2012 predicted temp" 
"1.79 (.84-2.73) ^schar(186)'C") 
title("Arctic temperature trend with 95% c.i. 
for predictions" 
, Size(medlarge) ) 


Arctic temperature trend with 95% c.i. for predictions 


2012 predicted temp 
4.79 (.84-2.73) °C 


Annual temperature anomaly ,°C 
2 


4 


0 


-1 





1980 1985 1990 1995 2000 2005 2010 
Year 
(16.7) الشكل‎ 


درجات الحرارة والمناطق المتجمدة والمتغيرات الأخرى من السلسلة 
الزمنية بملف البيانات Arctic9.dta‏ هي نوع ie‏ البيانات التي تنتج في العادة 
)5 تباطاً ذاتياً autocorrelation‏ أو ار SEN ihia‏ بين قيم البيانات المتوالية. 
إذا كانت أخطاء الانحدار في الواقع Aba a‏ ذاتيأء فإن هذا يعني أن 
المعادلات العادية للأخطاء المعيارية وفترات الثقة واختبارات الفرضيات - 
والتي تم استخدامها في هذا الجزء من الكتاب - يمكن أن تكون مضللة. 
وبالتالي فإن الباحثين في مجال بيانات السلاسل الزمنية ونماذجها يقوممون 
بشكل دوري بفحص الارتباط الذاتي الباقي» ويقومون بتطبيق طرق انحدار 
خاصة للسلاسل الزمنية عند الحاجة. 
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طرق انحدار السلاسل الزمنية (الفصل 12( تتطلب بيانات يجب 
اعتبارها بيانات خاصة بسلاسل زمنية باستخدام الأمر ctsset‏ هذا الأمر يحدد 
متغيرًا يستخدم كمؤشر للزمن. 
.tsset year‏ 
time variable: year, 1979 to 2012‏ 


delta:1 year 
بالنسبة لبيانات الأمر 64 هناك عدة طرق لفحص الارتباط الذاتيء‎ 
إحدى هذه الطرق معروفة ولكنها أقل تفصيلاء وهي اختبار دوربن واتسون‎ 
-Durbin-Watson 


.estat dwatson 
Durbin-Watson d-statistic( 2, 33) = 2.091689 


العديد من أدلة الاستخدام تحتوي على جداول للبحث عن اختبار دوربن 
واتسون» مع تقدير 33 مشاهدة ومعلمتين 2. فإن القيمة المحسوبة 2.09 تقع 
أعلى من 0.05-ه وهي الحد الأعلى للجدول. لذلك فإننا لا نرفض فرضية 
العدم القائلة بأنه ليس هناك ارتباط ذاتي موجب من الدرجة الأولىء؛ وهذا 
يعتبر Iis. Fd‏ لصلاحية الشكل )15.7( والشكل (16.7)» ويعني أنه لايوجد 
تأكيد حول وجود الارتباط الذاتي عند استخدام فترات تباطؤ مثل سنتين أو 
ثلاث أو أربع سنوات ماضية. 

هناك طريقة أكثر تفصيلاً لحساب الارتباط الذاتي لحساب مُعَاملات 
الارتباط الذاتي للبواقي عند استخدام فترات تباطؤ مع اختبار التجميع 
التراكمي أو إحصائية ليجنج بوكس كيو © .Ljung-Box‏ هذا الاختبار يمكن 
القيام به من خلال تطبيق الأمر corrgram‏ على بواقي النموذج (والتي تم 
تسميتها هنا .)tempNres‏ 


.predict tempNres, resid 
.Corrgram tempNres 
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ee‏ 


-1 0 ł -1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
ay -0.0803 -0.0826 -23248 0.6297 
2 -0.0920 -0.1081 .54749 0.7605 
3 -0.0494 -0.0746 .64146 0.8869 
4 -0.0249 -0.0461 -66619 0.9554 
5 0.2623 0.2818 3.5048 0.6227 
6 -0.1982 -0.2320 5.1858 0.5202 
7 0.1972 0.2678 6.9135 0.4379 
8 -0.0025 0.0217 6.9138 0.5460 
9 -0.1696 -0.2945 8.2974 0.5045 
10 0.1652 0.3323 9.6677 0.4701 
ad -0.2572 -0.5436 13.14 0.2843 
12 0.0647 -0.0919 13.37 0.3428 
13 -0.2205 -0.4464 16.177 0.2397 
14 0.0219 -0.0385 16.206 0.3009 


اختبارات © في جدول المخرجات odef‏ ليست ذات معنوية عند فترات 
تباطؤ من 1 إلى 14 سنة daal‏ لذا فإن الأمر Gil sy corrgram‏ بدرجة 
كبيرة مع نتائج الأمر estat dwatson‏ التي توضح بأنه ليس هناك ارتباط ذاتي 
ذو معنوية إحصائية في بواقي gisa‏ درجات الحرارة. في هذا الجزءء فإن 
الاختبارات» وفترات الثقة لم يتم إخضاعها إلى أي اختبارات إضافية أخرى. 


الرسومات البيانية التنشخيصية : Diagnostic Graphs‏ 





برنامج ستاتا يوفر العديد من الرسومات البيانية المفيدة بغرض تشخيص 
نتائج نماذج الانحدار. القليل من هذه الرسومات تم شرحها في هذا الجزء. 
للحصول على قائمة بهذه الرسومات قم بطباعة الأمر help regress‏ 
-postestimation‏ الأمثلة في هذا الجزء سوف تكون بمثابة تجربة على نموذج 
الجليد في القطب الشمالي الذي يُظهر بأن منطقة الجليد في شهر سبتمبر تم 
كديا الف دمو qu‏ إلى jn‏ ر ف ova‏ ]2-9 لبوك ع 
درجات الحرارة غير العادية السنوية (temp) el sell‏ بالنسبة لمتغير year‏ تم 
إجراء تمركز له (vear0)‏ وتم تربيعه (year02)‏ وتم حساب هذه المتغيرات 
gi a‏ هذا الفصلء ولكن تم إنشاء هذه المتغيرات من جديد بافتراض أنها 
غير موجودة» والمتغيرات التنبؤية الثلاثة la‏ تشرح نحو 2 من التباين 
في المنطقة الجليدية. 
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„use C:\data\Arctic9.dta, clear 
.gen year0 = year - 1995 

.gen year02 = year0 ^2 

.regress area year0 year02 tempN 





Source | 55 af MS Number of obs - 33 
—— F( 3, 29) = 49.72 
Model 19.2134599 3 6.40448663 Prob » F = 0.0000 
Residual 3.735237 29 .128801276 R-squared z 0.8372 

Adj R-squared = 0.8204 

Total 22.9486969 32 .717146777 Root MSE = .35889 
















Coef. Std. Err. t P»|t| [95$ Conf. Interval] 








yearÜ -.0601115 .0111399 -5.40 0.000 -.0828951 -.0373279 
year02 -.0019336 .0008202 -2.36 0.025 -.0036111 -.0002562 
temoN -.2796799 .1538498 -1.82 0.079 7.594338 .0349783 
-cons 5.24665 . 4 39.02 0.000 4.971666 5.521634 





كما شاهدنا في الجزء السابقء فإن اختبار بواقي الارتباط الذاتي معقول؛ 
حيث إن اختبار © وجد أنه لايوجد ارتباط ذاتي ذو معنوية إحصائية عند 
استخدام فترة تباطؤ واحدة وحتى عشر فترات تباطو عند مقارنة بواقي كل 
cua‏ ولكن الارتباط الذاتي يظهر عند استخدام فترات تباطؤ أكبر من 10 
ولكن هذا الارتباط الذاتي من غير المحتمل أن يؤثر على النتائج. 


.predict areares2, resid 
.corrgram areares2, lag(i0) 








-1 0 Loc 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
1 0.1140 0.1141 .46917 0.4934 
2 -0.1826 -0.2003 1.7112 0.4250 | 
3 -0.3273 -0.2968 5.8358 0.1199 
4 -0.0554 -0.0157 5.9581 0.2023 
5 0.0238 -0.1040 5.9816 0.3080 
6 -0.1620 -0.4049 7.1046 0.3113 
7 -0.1077 -0.1646 7.62 0.3673 
8 0.2332 0.3384 10.132 0.2559 
9 0.3583 0.2410 16.309 0.0607 
10 -0.0160 -0.2435 16.322 0.0908 


رسم بياني للبواقي مع القيم المناسبة يمكن إنشاؤه بواسطة حساب القيم 
المتوقعة؛ وإنشاء رسم بياني للمتغير 2 مع بقية المتغيرات الأخرى. 
الطريقة الأسر ع للقيام بذلك تتم باستخدام الأمر arviplot‏ المثال في الشكل 
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)17.7( يُضيف Gl las‏ لمستوى الصفر والمتوسط المتبقي» كما أنه يعطي 
lua,‏ لنقاط البيانات لكل سنة year‏ » كما أن الشكل يوضح بأن قيمة متطرفة 
واحدة مع قيمة متبقية موجبة مرتفعة )1996( ولكن لا توجد إشارة واضحة 
عن وجود مشاكل. 

.rvfplot, yline(0) mlabel (year) 
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Fitted values 
(17.7) الشكل‎ 

الرسم البياني للقيم المضافة تعتبر أدوات agi‏ وتعرف بأسماء عديدة 

منها: رسم بياني لتأثير الانحدار الجزئيء أو رسم بياني للبواقي الجزئية 
المعدلة» أو رسم بياني للمتغيرات المعدلة. وهذه الرسومات البيانية en‏ 
العلاقة بين المتغير برومتغير × واحد» وهي تعديل لتأثيرات متغيرات x‏ 
الأخرى. وإذا كنا قد Lid‏ بحساب انحدار المتغير y‏ على المتغيرين 3× x2,‏ أو 
بالمئل حساب انحدار المتغير 7« على المتغيرين 3× ,2+ ثم نأخذ البواقي من 
كل انحدار ونقوم بإنشاء رسم بياني لهذه البواقي. وسوف نقوم بإنشاء رسم 
بياني لمتغير إضافي يوضح العلاقة بين المتغير ر والمتغير xl‏ والمتغيرين 
المعدلين x3‏ ,2ب الأمر avplot‏ يقوم بالحسابات الضرورية بشكل تلقائي. فمثلاً 
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إنشاء رسم بياني لمتغير إضافي للمتغير التنبؤي tempN‏ تتم من خلال طباعة 
الأمر: 
.avplot tempN‏ 
ولتسريع الحسابات أكثر « يمكننا القيام باستخدام الأمر 15 للحصول 
على مجموعة من الرسومات البيانية الصغيرة لكل متغير تنبؤي في تحليل 
الانحدارء الشكل )18.7( يعرض نتائج الانحدار للمتغير area‏ على المتغيرات 
yearü, year02, tempN‏ الخطوط المرسومة في أشكال المتغير الإضافي لها 
ميل يساوي مُعاملات الانحدار الجزئية المقابلة. فعلى سبيل المثالء ميل الخط 
عند أسفل i did‏ في الشكل (18.7) يساوي 0.2797- وهو بالضبط معامل 
المتغير tempN‏ للخلاثة متغيرات التنبؤية في تحليل الانحدار. l‏ 
.avplots‏ 


e(area| X) 
0 .5 


45 
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coef = -27967986, se = 15384979, t = -1.82 


الشكل )18.7( 


الرسومات البيانية للمتغير الإضافي تساعد في تحديد المشاهدات التي لها 
تأثير غير متكافئ في نموذج الانحدار. أما في الانحدار المتعددء فإن إشارات 
التأثير تصبح أقل حدة» والمشاهدة التي بها مجموعة من القيم غير العادية في 
عدد من متغيرات + قد يكون تأثيرها مرتفعاً أو من المحتمل أن تؤثر على 
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الانحدار حتى ولو كانت إحدى قيم المتغير × هي نفسها فو ادت 
المشاهدات ذات التأثير المرتفع تظهر في الرسم البياني للمتغير المضاف على 
شكل نقاط يمكن تمييزها عن باقي البيانات. وأغلب النقاط المتطرفة التي 
تظهر في الشكل (18.7) تظهر في مواقع ثابتة مع باقي البيانات الأخرى. 
إحدى القيم المتطرفة تظهر في الرسم البياني في أعلى اليمين في الشكل 
)7 .18( وتشير إلى تأثير محتمل أشد انحدارا (جعله أكثر سلبية) لمعامل 
المتغير 02٣۸ء‏ عندما نقوم بإنشاء رسم بياني لأحد المتغيرات المضافة 
باستخدام الأمر avplot‏ وتوصيف نقاط بيانات الرسم» فإن سنة 1996 تظهر 
أنها هي تلك القيمة المتطرفة. 
avplot year02, mlabel( year)‏ . 
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e( year02 | X )‏ . 
coef = -.00193363, se = .00082017, t = -2.36‏ 


الشكل )19.7( 


الرسومات البيانية للبواقي مضافاً إليها مكوناتها (والتي تم إنشاؤها 
(cprplot 24 Mud‏ فإن المتحنى يأخذ شكلاً مختلفاً. فالرسم البياني 
للبواقي مضافاً إليها مكوناته للمتغير Uus x]‏ نيانياً كل باقي ag} libus a‏ 
مكونه» فإن نموذج التنبؤ للمتغير xl‏ هو: 


eitb; xl; 
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مع قيم المتغير cx]‏ مثل هذه الأشكال البيانية قد تساعد في تشخيص عدم 
الخطيّة» وتشير إلى نماذج عملية بديلة. الرسم البياني Jil‏ للبواقي مضففاً 
Led dla gl‏ تعمل بطر Wi‏ ريا ied‏ » بالرغم من أن كلا النوعين في العادة 
يعطيان نتائج غير حاسمة )1986 «(Mallows‏ الشكل )7 .20( يعرض شكلاً 
ER‏ أكبر للبواقي مضافاً إليها مكوناتها الناتجة من انحدار المتغير area‏ على 


.year0, year02, tempN المتغيرات‎ 
.acprplot tempN, lowess 
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الشكل )20.7( 


الخط المستقيم بالشكل )20.7( يتطابق مع نموذج الانحدار» بينما الخط 
المنحني يعكس تجانس المربعات الصغرى الموزونة المحليةء والتي يمكن أن 
تعرض لنا عدم الخطيّة أكثر. انخفاض المنحنى عند نهايته في الجانب الأيسر 
يمكن إهماله واعتباره مربعات صغرى موزونة اصطناعية» حيث هناك 
حالات قليلة تحدد اتجاهات هذا المنحنى (انظر الفصل 8). إذا كانت هناك 
أجزاء مركزية أكثر في منحنى المربعات الصغرى الموزونة تعرض نمطا 
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منهجياً لانتقال المنحنى من نموذج الانحدار الخطي» فسوف يكون لدينا سبب 
للشك في كفاءة النموذج. في الشكل )20.7( قيم الوسيط للبواقي مضافاً إليها 
مكوناتها تتبع بشكل كبير نموذج الانحدار. الشكل يدعم النتائج التي تقول إن 
نموذج الانحدار الحالي يأخذ في الاعتبار عدم الخطية التي توجد في البيانات 
الخام ولا يترك أي بواقي. 

كما يبدو Lat‏ أن الرسم البياني يعرض تربيع البواقي مقابل التأثير(الخط 
المائل لمصفوفة التقدير) مع تربيع البواقي؛ الشكل )21.7( يعرض مثل هذا النوع 
من الرسم لانحدار المتغير tarea‏ ولتحديد القيم المتطرفة الفردية سوف نقوم 
بتوصيف العلامات بالرسم البياني بالسنوات «ear‏ الخيار miabsize(medsmall)‏ 
يحدد Gh‏ أسماء العلامات سوف تكون متوسطة الحجم» وهي بطريقة ما أكبر من 
الحجم الافتراضي وهو الحجم الصغير (للحصول على قائمة بالخيارات الأخرى 
لحجم النص» قم بطباعة الأمر «(help testsizestyle‏ الخيار mlabpos(11)‏ يضع 
هذه الأسماء عند موقع الساعة 11 بالنسبة لرموز العلامات. أغلب السنوات في 
الرسم البياني تظهر متشابكة في أسفل اليسار في الشكل )21.7( ولكن سنة 
6 تظهر متطرفة في الخارج مرة أخرى. 


.lvr2plot, mlabel(year) mlabsize(medsmall) 
mlabpos (11) 





zt .15 
Normalized residual squared 


الشكل )21.7( 
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خطوط التأثير مع تربيع البواقي بالرسم البياني توضح متوسطات التأثير 
(الخط الأفقي)» « وتربيع البواقي (الخط العمودي). التأثيريوضح احتمالية تأثير 
RE‏ وي L ax Haie laine‏ قيم 
المتغير × المتطرفة أو المجموعات غير العادية فلها قيم تأثير Aad ye‏ كما أن 
الازتفاع في تربيع البواقي يشير إلى أن مشاهدة ما مع قيمة للمتغير ر CALS‏ 
كثيراً عن القيمة المتوقعة بواسطة نموذج الانحدار» سنة 1996 لها أكبر 
تربيع للبواقي» وهذا يشير إلى أن النموذج أقل تناسباً مع تلك السنة» ولكن 
القيم المكونة للنموذج وهي المتغيرات tempN‏ و year‏ تقع في المنتشصف› 
وبالتالي فإن تأثير سنة 1996 أقل من المتوسط. 

الرسومات البيانية التشخيصية والإحصائيات الأخرى تُشير إلى 
المشاهدات المؤثرة أو المشاهدات التي يُحتمل أن يكون لها تأثير ولكن هذه 
الرسومات لا توضح ما إذا كان يجب علينا استبعاد هذه المشاهدات» هذا 
يتطلب قرارًا موضوعياً بناءً على تقييم دقيق للبيانات» وتقييم للبحث بصفة 
dale‏ وليس هناك تبرير موضوعي لاستبعاد سنة 1996 في SLAs‏ الجليد 
بالقطب الشمالي» ولكن يُفترض - للتوضيح فقط - أن نحاول إجراء ذلك 
على أي حال. وكما يُتوقع من التأثير المنخفض لسنة 1996 فإن إهمال هذه 
السنة يؤدي إلى اختلاف بسيط لنتائج تحليل انحدار carea‏ مُعَاملات المتغيران 
ids csii-year0, tempN‏ هي نفسها مع تأثير يصبح ذا معنوية إحصائية 
للمتغير stempN‏ أما معامل المتغير 2 يصبح E:‏ ب للصفرء 5 4381 مازال 
Ru Ula‏ معتوية 3a 3 22, agha)‏ زيادة طفيفة من | 2 إلى 0.85 عند 
استبعاد سنة 11996 في الحقيقة فإن هذه الاختلافات تعتبر طفيفة وليس Wa‏ 
سبب موضوعي لاستبعاد سنة 1996. النتائج توضح أنه من الأفضل الإبقاء 
على سنة 1996 فى التحليل. 

.regress area year0 year02 tempN if year!-1996 
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Source Number of obs = 32 
FG 3; 28) = 61.82 

Model 18.9699037 3 6.32330125 Prob > F = 0.0000 
Residual 2.8540433 28 .102287261 R-squared = 0.8688 
Adj R-squared = 0.8548 

Total 21.8339471 31 .704320873 Root MSE = .31982 


Coef. Std. Err. £ P>|t| [95% Conf. Interval] 









-.0602946 .0099275 -6.07 0.000 -.0806302 -.0399591 

year02 -.0015288 .0007439 -2.05 0.049 -.0030527 -4.87e-06 
tempN -.2820721 .1371057 -2.06 0.049 -.5629203 -.0012239 

_cons 5.182538 .1218136 42.54 0.000 4.933014 5.432062 





دراسات كل من Cook and Weisberg 5 (1983) Cahmpers et al.‏ )1994( 
تعطي أمثلة أكثر تفصيلا وشرحا للرسومات البيانية التشخيصيةء والطرق 
البيانية الأخرى لتحليل البيانات. 


oa 
طرق الانحدار المتقدمة‎ 


Advanced Regression Methods 








الفصل السابق ركز على تحليل الانحدار بطريقة المربعات الصغرى 
OLS)‏ ولأسباب عدة فإن OLS‏ إلى حد كبير تعتبر أكشر طرق تحليل 
الاتحدار استخداماً. هذا الفصل يركز على مجموعة مختارة من طرق تحليل 
الانحدار «s S‏ والتي لها تطبيقات عدة» مع محاولة التركيز على 
التعقيدات التي لا توجد في طريقة «OLS‏ وبالرغم of os‏ حساب الانحدار 
بالطرق الأخرى أكثر تركيزاً من 5 بسبب كثرة التحديات الرياضية» فإن 
هذه الطرق ليست صعبة الاستخدام ببرنامج ستاتا. 
ليس هناك تسلسل معين لشرح مثل هذا الموضوع المتتوع؛ ولكن كل 
جزء في هذا الفصل ت تمت كتابته ليكون مستقلاً بذاته» لذا فإن القارئ يمكنه 
الانتقال بين هذه الأجزاء دون الحاجة إلى قراءة الجزء السابقء وتم العمل 
على جعل الأمثلة في هذا الفصل بسيطةء مع الإشارة إلى المصادر الأخرى 
التي يمكن أن يجد فيها القارئ تفاصيل أكثر. 
مجموعة القوائم أدناه تغطي أغلب العمليات التي تمت تمت مناقشتها في هذا 
الفصل» أحد هذه الموضوعات هو الانحدار غير «ball‏ والذي يتطلب 
استخدام الوب sal A‏ بيدلا من القوائم. 
Graphics < Twoway graph (scatter, line etc.)‏ 
Statistics < Nonparametric analysis < Lowess smoothing‏ 
Statistics » Linear models and related » Other » Robust regression‏ 
Statistics > Linear models and related > Quantile regression‏ 


Statistics > Linear models and related > Box-Cox regression 
Statistics > SEM (Structural Equation Modeling) 
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Example Commands : عن الأوامر‎ aint 





.boxcox y x1 x2 x3, model (lhs) 
-= يقوم بإيجاد أكبر التقديرات المتوقعة للمعلمة ۸ (لمدا) لتحويل كوكس‎ 
زائداً أخطاء التباين‎ x3, 32, ×1 خطية للمتغيرات‎ Alla بوكس للمتغير ۳ر وهي‎ 
يحدد التحويل للطرف الأيسر للمتغير بن‎ model(ths) الثابت لجاوس. الخيار‎ 
وذلك‎ ex وهناك خيارات أخرى يمكن تحويلها للطرف الأيمن وهي متغيرات‎ 
للتحكم بشكل أكثر في تفاصيل نموذج الانحدار؛ للحصول على تفاصيل عن‎ 
كما‎ «help boxcox كيفية بناء الأمر أعلاه وقائمة بخياراته قم بطباعة الأمر‎ 
تفاصيل نقنية أكثر.‎ c يشر‎ Base Reference Manual أن دليل المستخدم‎ 
.graph twoway mband y x, bands(10) || scatter y x 
يقوم بإنشاء رسم بياني لشكل انتشار المتغير ر على المتغير دمع خط‎ 
مع‎ (y وسيط المتغير‎ x يصل نقاط الوسيط ببعضها (نقاط وسيط المتغير‎ 
نقاط لكل نطاق» وهذا أحد أنواع نطاقات الانحدارء‎ 10 es نطاقات أفقية‎ 
في هذا الأمر» فإن ذلك‎ mband JLA من‎ Y» mspline وعند طباعة الخيار‎ 
LL il متحلى مال يمر يكل‎ Med gg سوت يودي إلى توصيل,نقاط الوسيط‎ 
بدلاً من خط متصل بين كل نقطة وأخرى.‎ 
.graph twoway 10688 y x,bwidth(.4)|| scatter y x 
ويقوم‎ x يقوم بإنشاء رسم بياني لنقاط انتشار للمتغير رمع المتغير‎ 
بحساب المر بعات الصغرى الموزونة المحلية باس تخدام‎ bwidth(.4) الخيار‎ 
عرض قدره 0.4 )7640 من البيانات) وحتى يمكننا إنشاء قيم متجانسة‎ 
فإنه يجب استخدام الأوامر المتعلقة بالمربعات الصغرى‎ cara كمتغير‎ 
الموزونة (يتناولها المثال التالي).‎ 
.lowess y x, bwidth(.3) gen(newvar) 
المتجانسة مع شكل‎ A3 s 5 gall يقوم بإنشاء رسم بياني للمربعات الصغرى‎ 
باستخدام نطاق سُمكه 0.3 )9630 من‎ x على المتغير‎ y انتشار المتغير‎ 
القيم المتوقعة لهذا المنحنى سوف يتم تخزينها في متغير جديد باسم‎ (citi 
بالأمر ئ خيار حفظ القيم المتوقعة» وهذا الخيار لا يمكن‎ as gi newvar 


^ 
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القيام به باستخدام الأمر «graph twoway lowess‏ وللحصول على مزيد من 
التفاصيل قم بطباعة الأمر l -help lowess‏ 
.nl (yis(b1z1)*(b2-1)^x)‏ 
يقوم هذا الأمر باستخدام المربعات الصغرى غير الخطية المتعاقبة 
لتتناسب مع معلمتين في نموذج النمو mb GaN‏ والمعلمتان اللتان يتم 
تقديرهما هما 1ط و02 محاطتان بالأقواس في الأمر أعلاه ( ) مع بداية 
مقترحة تبدأ بقيمة (1)؛ وبدلاً من كتابة النموذج في سطر الأمرء يمكننا توفير 
الوقت من خلال استخدام أحد أوامر النماذج المتوافرة في برنامج ستاتا أو 
كتابة برنامج جديد لتعريف نموذجنا الجديد. والمعلمتان الأسيّتان تحدثان 
لتكون واحدة من النماذج الأكثر شيوعاً ويتم تعريفهما بواسطة برنامج ستاتا 
باسم cexp2‏ وبالتالي فإنه بإمكاننا القيام بنفس المهمة التي قام بها الأمر أعلاه 
وذلك من خلال طباعة الأمر: 
)1 2ط 1 .nl exp2: y x, init(b1‏ 
بعد طباعة الأمر nl‏ قم باستخدام الأمر predict‏ لاستخراج القيم المتوقعة 
أو البواقي. 
b3 50)‏ 1. 2ط 25 .nl log4: y x, init(b0 5 b1‏ 
الأمر أعلاه يتناسب مع 4 معالم لنموذج النمو اللوغاريتمي (log4)‏ ليكون 
على الشكل التالي: 
exp(-bz (x - b3)))‏ + 1)/ رط + bo‏ = بر 
قم بتحديد القيم المعلمية الأولية لعملية التقدير المتعاقبة عند 00=5ء 
cb1-25‏ 0.1 = 52« 50= 03؛ الخيار 4ج10 يشبه الخيار Cys cexp2‏ إنه أحد 
النماذج غير الخطيّة الموجودة ببرنامج ستاتا. ‏ . 
.Sem (y«- x1 x2 x3 x4) (x1<- x3 x4) (x2«- x3 x4)‏ 
هي نموذج لمعادلة هيكلية والتي يكون Sig ×3, x2, ×1 lgà‏ على y xl,‏ 
2 وهي متغيرات متداخلة كل منها يتم التأثير عليها بواسطة x3, x4‏ 
.rreg y x1 x2 x3‏ 
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يقوم بحساب الانحدار الموثوق للمتغير رمع ثلاثة متغيرات تنبؤية 
باستخدام المريعات: الضغرى الموزونة التكرارية مع المعادلاث الثنائية 
ومعادلات هوبر Huber‏ عند مستوى 9695 لكفاءة جاوس» بافتراض أن 
البيانات تم تجهيزها بطريقة Apulia‏ فإن الأمر rreg‏ يمكنه أيضاً حساب 
المتوسطات الموثوقة وفترات الثقة والاختلافات في اختبارات المتوسطات 
والتباين أو التغاير. 


.rreg y x1 x2 x3, nolog tune(6) genwt(rweight) 
iterate(10) 


يقوم بإجراء تحليل الانحدار الموثوق للمتغير رمع ثلاشة متغيرات 
تنبؤية؛ الخيارات المعروضة أعلاه تطلب من برنامج ستاتا عدم طباعة سجل 
المحاولات. قم باستخدام ثابت ضبط مقداره 6 (والذي يقلل من القيم المتطرفة 
بقوة أكثر من الوضع الافتراضي 7( ولإنشاء متغير (عشوائياً يسمى 
ee ia (rweight‏ على الأوزان الموثوقة للتكرار النهائي QS]‏ مشاهدة ويحدد 
الحد الأعلى للتكرار ليكون 10. 
.qreg y xí x2 x3‏ 
يقوم بحساب الانحدار الربيعي» والذي يُعرف كذلك باسم أقل قيمة مطلقة 
(LAV)‏ أو باسم الانحدار المعذل LI‏ للمتغير y‏ على ثلاثة متغيرات تنبؤية» 
والوضع الافتراضي أن gila‏ الأمر qreg‏ تقوم بحساب الانحدار عند الربيع 
5 (الوسيط تقريبا) للمتغير ر كدالة خطيّة للمتغيرات التنبؤية: وبالتالي 
يعطي الانحدار الوسيط. 
.qreg y x1 x2 x3, quantile ) .25(‏ 
يقوم بحساب الانحدار الربيعي عند الربيع 0.25 (الربيع الأول) للمتغير 
y‏ كدالة خطيّة للمتغيرات x2, x]‏ ,3×. 


انس اطربعات الصعرى اطرجحة Lowess Smoothing : duldbl‏ 
تم الإشارة إلى تجانس المربعات الصغرى المرجحة iiu (lowess)‏ في 


أكثر من موضوع من هذا الكتاب بدون شرح العديد من النقاط. تجانس 
المربعات الصغرى المرجحة هو أداة مفيدة للانحدار اللامعلمي؛ وعموماً فإن 
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طرق الانحدار اللامعلمية لا تحدد معادلة انحدار واضحة ولا تتطلب من 
التحليل مقدماً أن يحدد شكلاً عملياً للعلاقة. وبدلاً من ذلك» فإن هذه الطضرق 
تساعد على اكتشاف البيانات بطريقة idea ESE‏ هذا الإجراء يمكنه 
الكشف عن نتائج مثيرة أو غير متوقعة. 

الأمر lowess‏ والأمر graph twoway lowess‏ يمكنهما إجراء التجانس 
(تجانس شكل الانتشار المرجح المحلي)» الأمر lowess‏ مع الخيار generate‏ 
يمكنه حفظ القيم المتوقعة. الأمر graph twoway lowess‏ يتميز بالبساطة 
ويتبع نفس التركيب المعتاد الذي سبق استخدامه في هذا الكتاب» وله إمكانية 
دمج أكثر من شكل بياني في شكل واحد كما Pian‏ سابقاً في مجموعة أو امر 
-graph twoway‏ وكمثال بسيط سوف نقوم بإجراء رسم بياني لدرجات 
الحرار ة العالمية غير العادية باستخدام مجموعة البيانات بالملف global3.dta‏ 
والتي سبق استخدامها في الفصل (2). 


.use C:\data\global3.dta, clear 
.describe 


Contains data from C:\data\global3.dta 








obs: 1,584 Global climate 

vars: 5 4 Jul 2012 11:21 

Bize: 20,592 

storage display value 

variable name type format label variable label 
year int $8.0g Year 
month byte — $8.0g Month 
edate int Stdmcy elapsed date 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 
mei float %9.0g Multivariate ENSO Index 





Sorted by: year month 


درجات الحرارة العالمية غير العادية في الفترة من 1880 إلى 2011 
توضح تبايناً loge‏ من شهر AY‏ ومن سنة لأخرى» ومن المستحيل 
ملاحظة ما إذا كان التغير المناخي على المدى الطويل يتجه نحو ازدياد 
الحزارة أو للبرودة أو سيبقى LS‏ هىء قجاس ts all Cay yal‏ الموزونة 
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يساعد في ملاحظة التغير في المدى الطويل الذي يكمن في التقلبات الشهرية 
الشكل )1.8( ido Us inde‏ لدرجات الحرارة والتواريخ الماضية 
(twoway line femp edate)‏ ثم يتم تركيب هذا الرسم على منحنى تجانس 
المربعات الصغرى المرجحة مع نطاق diy‏ 0.3 وخط أكثر مك 
لتو ضيحة «(lowess temp edate, bw(.3) Iwidth(thick))‏ وللحصول على 
معلومات عن الخيارات الأخرى للخطوط البيانية قم بطباعة help > AVI‏ 
-linewidthstyle‏ 


.graph twoway line temp edate 
|| lowess temp edate, bw(.3) lwidth(thick) 
|| , 1egend(position(11) ring(0) rows(2)) 





= NCDC global temp anomaly vs 1901-2000, C 
== lowess temp edate 





Jan1880 Jan1900 Jan1920 Jan1940 Jan1960 Jan1980 Jan2000 Jan2020 
elapsed date 
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منحنى lowess‏ في الشكل )1.8( يعرض بوضوح مراحل ازدياد درجات 
الحرارة في فترة مبكرة من القرن العشرين Lagai)‏ خلال الفترة 1920- 
0) والانخفاض في درجات الحرارة في منتتصف القرن؛ والازدياد 
السريع في درجات الحرارة Le)‏ بعد سنة 1970( تتضمن goce Lha‏ 
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للتغيرات في المناخ العالمي» نفس المراحل تظهر كذلك في البيانات المحلية 
في تواريخ ذوبان' الجليد لبحيرة وينيبسودكي Lake Winnipesaukee‏ والذي 
يظهر في الشكل (26.3) في الفصل (3). 

655 يتوقع تجانس قيم المتغير y‏ لعدد 7 من المشاهدات الناتج من 
عدد من تحليلات الانحدار الموزونة on‏ بافتراض أن ٭ يمثل نصف النطاق 
مع التقريب إلى أقرب عدد صحيح. لكل متغير y,‏ قيمة متجانسة ر يمكن 
الحصول عليها بواسطة الانحدار الموزون الذي يتضمن هذه المشاهدات 
الموجودة في المدى i-max(1,i-k)‏ وحتى Gus i = min (itka)‏ إن المشاهدة 
التي ترتيبها jth‏ في المدى المحدد لها وزن ر« وذلك حسب دالة ثلاثية 
التكعيب: 





w,7 (1-y 


uj; = (x — xy ^‏ 
A‏ عبارة عن اختصار للمسافة بين x,‏ وأبعد قيمة في الفترة: الأوزان 
تساوي 1 لكل xix‏ ولكن هذه الأوزان قد تنخفض إلى الصفر عند حدود 
الفترة» )—h‏ در اسة Chambers et al.‏ )1983( أو دراسة Cleveland‏ )1993( 
للحصول على تفاصيل وأمثلة عن طرق تجانس المربعات الصغرى المرجحة. 
خيارات الأمر 55 تتضمن التالي: 
mean‏ وذلك لحساب المتوسط المتجانس» الوضع الافتراضي هو 
وضع خط تجانس المربعات الصغرى. 
noweight‏ التجانس غير الموزون» والوضع الافتراضي هو حساب دالة 
كليفلاند Cleveland‏ الموزونة ثلاثية التكعيب. 
0 تحديد المدى للمجموعات الفرعية المتجانسة لمدى من 
المشاهدات 0 x‏ التي تم استخدامها للتجانس - باستثناء نقاط 
النهاية التي تكون أصغر - وفترات عدم التأكد المستخدمة» 
الوضع الافتراضي هو bwidth(.8)‏ 
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logit‏ تحويل القيم المتجانسة إلى قيم لوغاريتمات. 
adjust‏ تعديلات المتوسط للقيم المتجانسة لتساري hu gia‏ المتغير ر 
f‏ الأصلي مثل logit, adjust‏ وهي مفيدة مع المتغير الثنائي y‏ 
gen(mewvar)‏ إنشاء متغير جديد اسمه newvar‏ يحتوي على القيم المتجانسة 
' للمتغير بر. 
nograph‏ يمنع هذا الخيار عرض الرسم البياني ضمن النتائج. 


0 تتم إضافة رسومات بيانية أخرى للرسم البياني الموجودء 
ولمزيد من التفاصيل قم بطباعة -help addplot option‏ 


0 يوئر على عرض خط التجانس» ولمزيد من التفاصيل قم 
بطباعة chelp cline options‏ وحيث إن هذا يتطلب n‏ من 
الانحدارات الموزونة لذلك فإن تجانس المربعات الصغرى 
المرجحة قد يستغرق (By‏ عند حسابه للعينات الكبيرة. 

مثل طرق التجانس GAY‏ (أو أي نموذج)ء فإن تجانس المربعات 
الصغرى المرجحة يقوم بتقسيم البيانات إلى أجزاء: جزء متجانس Qs‏ 
المنحنى السميك في الشكل )8 .1( وجزء تقريبي وهو في اليسار بعد طرح 
التجانس من البيانات. وعادة فإن الجزء التقريبي يحتوي على معلومات مفيدة 
ES‏ ولشرح ذلك سوف نقوم بالانتقال إلى مجموعات بيانات عن طبقات 
الجو العليا خلال عدة قرون زمنية وهي تتضمن قياسات تم الحصول عليها 
من الطبقات الجليدية ala‏ جرين لاند (GISP2)‏ وهذه البيانات تم شرحها في 
دراسة Mayewski, Holdsworth and colleagues‏ )1993( ودراسة Mayewski,‏ 
Meeker and colleagues‏ )1993(« وقد قام الباحثان بالحصول على عينات من 
هذا الجليد وتحليلها EE‏ وهذه البيانات تمثل أكثر من 100,000 سنة من 
التغير المناخي» هذه البيانات موجودة بالملف Greenland sulfate.dta.‏ 
وتتضمن lo je‏ بسيطاً من المعلومات عن تركيز الأملاح الكبريتية غير 
البحرية» ومؤشر عن كثافة التوزيع القطبية. 


.use C;\data\Greenland_sulfate.dta, clear 
.describe 
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ee‏ م c PEERS‏ 


Contains data from C:\data\Greenland_sulfate.dta 








obs: 271 Greenland ice core sulfate & PCI, 1500-1985 

(Mayewski 1993) 

vars: 3 2 Jul 2012 06:11 

size: 4,878 

Storage display value 

variable name type format label variable label 

year int Sty Year 

sulfate double $10.0g S04 ion concentration, ppb 

PCI double $6.0g Polar Circulation Intensity 





Sorted by: year 


وللحصول على تفاصيل أكثر عن السلسلة الزمنية التي تحتو ي على 
1 نقطةء يجب القيام بتجانس مع نطاق ضيق يُعادل 5 من العينة. الشكل 
)2.8( يعرض رسماً Lily‏ لنتائج المتغير sulfate‏ وهو يمثل تركيز الأملاح 
الكبريتية غير البحرية. 


.graph twoway line sulfate year 
lowess sulfate year, bwidth(.05) 
lwidth (medthick) 
|| , ytitle("so{subscript:4} ion 
concentration, ppb") 
legend(label(1 "raw data") label(2 "lowess 
smoothed") 
position(11) ring(0) rows(2)) 


o 
g] 
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raw data 
lowess smoothed 
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الأملاح الكبريتية غير البحرية (SO)‏ وصلت للمنطقة الجليدية بجرينلاند 
بعد أن تم إضافتها في طبقات الجو عن طريق البراكين أو الوقود المستخرج 
من الفحم والنفط. كلا المنحنيين (المتجانس والخام) بالشكل (2.8) يعطيان 
هذه المعلومات. المنحنى المتجانس يعرض GS‏ بأعلى من المتوسط بقليل 
من 1500 وحتى بدايات سنوات 1800( Led‏ بعد 1900 فإن الوقود 
المستخرج قد دفع منحنى التجانس إلى الارتفاع مع انخفاض موقت بعد سنة 
9 (فترة الكساد العظيم) وبدايات السبعينيات (التأثير الناتج من القانون 
الأمريكي للهواء النظيف في سنة 1970ء وحصار النفط العربي في سنة 
73 والارتفاع الكبير في أسعار النفط الذي صاحب حصار (bial‏ أغلب 
الرؤوس المدببة في منحنى البيانات الخام تم تحديدها مع ثورات البراكين 
المعروفة مثل بركان هيكلا Hekla‏ في أيسلاند (1970) أو بركان كاتماي 
Katmai‏ في آلاسكا (1912). 
بعد تجانس بيانات السلاسل الزمنيةء فإنه من المفيد دراسة التجانس 
والتقريب (البواقي) للسلاسل بشكل منفصلء olif‏ قمنا باستخدام الأمر lowess‏ 
لتحديد متغيرين جديدين: الأول للقيم المتجانسة للأملاح الكبريتية (smooth)‏ 
والثاني للبواقي أو القيم التقريبية (rough)‏ ويتم حسابها بطرح القيم المتجانسة 
من البيانات الخام. 
.lowess sulfate year, bwidth(.05) gen(smooth)‏ 
.label variable smooth "SO4 ion concentration‏ 
(smoothed)"‏ 
.gen rough = sulfate - smooth‏ 


.label variable rough "504 ion concentration 
(rough) " 


الشكل )3.8( يقار ن بين السلاسل الزمنية للمتغير smooth‏ والمتغير rough‏ 
في زوج من الرسومات البيانية التي تم وضع شروح لها باستخدام الخيارات 
Lay 0‏ استخدام الخيارات saving)‏ في بداية أول أمرين لإنشاء الرسم 
البياني» هذان الشكلان تم وضعهما في شكل واحد باستخدام الأمر graph‏ 
combine‏ في الشكل الموحّد تم استخدام محور أفقي واحد وتم وضع عنوان لهذا 
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المحور باستخدام cbt brtitle( Year")‏ في بداية الأمريشير أول عنوان في 
الأسفل» الشكل as gall‏ لا يتعرّف على المحور × والمحور OSS y‏ يتعرآف على 
العنوان أسفل b1) JSAM‏ و2)ء وبالنسبة للعناوين في يسار الشكل (11 و12) 
والعناوين في أعلى الشكل )1 125( وفي يمين الشكل r2 r1)‏ في الشكل 
)3.8( عنوان المحور العمودي i y‏ إنشاؤه في بداية اليسار وذلك باس تخدام 
الخيار -Htitle("SO(subscript:4) ion concentration, ppb")‏ 


graph twoway line smooth year,ylabel(0(50)150) 
xtitle("") 
lwidth (medthick) lcolor (maroon)ytitle("Smoothed") 
text(20 1540 "Renaissance") text(20 1900 
"Industrialization") 
text(90 1860 "Great Depression 1929") 
text(150 1935 "Oil Embargo 1973") 
saving(fig08 03a.gph, replace) 

.graph twoway line rough year, ylabel(0(50)150) 
xtitle("") 
ytitle("Rough") text(75 1630 "Awu 1640", 
orientation(vertical)) 
text(120 1770 "Laki 1783", 
orientation(vertical)) 
text(90 1805 "Tambora 1815", 
orientation(vertical)) 
text(65 1902 "Katmai 1912", 
orientation(vertical)) 
text(80 1960 "Hekla 1970", 
orientation(vertical)) 
yline(0) saving(fig08 03b.gph, replace) 

-graph combine fig08 03a.gph fig08 03b.gph, 
rows (2)bititle("Year") 
lititle("SO{subscript:4} ion concentration, 
ppb") 
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Robust Regression : أطوثوق‎ jus 


يقوم الأمر regress‏ والأمر anova‏ بحساب انحدار المربعات الصغرى 
العادي (OLS)‏ القبول الكبير ل (OLS)‏ كان يرجع à - Suas a] Loa‏ 
النظرية هذا في حالة الحصول على البيانات الصحيحة» وإذا كانت الأخطاء 
موزعة توزيعاً طبيعياً مستقلاً ومحددا فإن OLS‏ يعتبر أكثر كفاءة من أي 
مُقدّر آخر غير متحيّز. الجانب الآخر من هذه العبارة هو إذا كانت الأخطاء 
غير de joe‏ :توزيعاً طبيعياً daas s Situs‏ قاق a NI ed fall‏ غير 
المتحيزة قد تكون أفضل من OLS‏ وفي الحقيقة فإن OLS $e L 3S‏ تنخفض 
بسرعة في مواجهة توزيعات خطأ ذات منحنى توزيع طبيعي ذو ذيل طويل 
(قيم متطرفة - ذات نزعة)» مثل هذه التوزيعات مازالت موجودة بشكل كبير 
في العديد من المجالات والحقول العلمية. 
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تميل OLS‏ إلى تتبع القيم المتطرفة على حساب باقي القيم الموجودة 
بالعينة. وخلال المدى الطويلء فإن هذا يقود إلى تباين كبير من عينة إلى 
عينة أو عدم الكفاءة عند احتواء العينات على قيم متطرفةء لذا فإن الانحدار 
الموثوق يهدف إلى تعظيم كفاءة OLS‏ في حالة وجود بيانات مثالية وزيادة 
هذه الكفاءة في الأوضاع المعقدة مثل وجود أخطاء غير طبيعية. الانحدار 
الموثوق يشمل تقنيات متنوعةء كل تقنية لها مميزاتها وعيوبها عند التعامل 
مع البيانات المعقدة. في هذا الجزء من الكتاب» سوف يتم شرح نوعين من 
الانحدار الموثوق هما qreg y rreg‏ وسوف تتم مقارنتهما مع sregress‏ 

لاحظنا في الفصل (7) الانخفاض الواضح والحاد في المنطقة المنخفضة 
لحجم الجليد في المناطق القطبية خلال s jill‏ 2011-1979 ولكن ماذا 
حول جليد البحر في المنطقة القطبية الجنوبية؟ النمط الجغرافي والفصلي 
للمنطقة القطبية الجنوبية يختلف عما هو عليه في المنطقة القطبية الشمالية. 
ففي وسط القطب الشمالي المحيط مُحاط باليابسة والتي أصبحت أكبر بعد 
الزيادة الكبيرة في ذوبان الجليد في السنوات الأخيرة» Cus‏ إن اليابسة زادت 
مساحتها بأكثر من 3 ملايين كيلومتر مربع أو 4 ملايين كيلومتر مربع في 
المنطقة التي بها %15 على الأقل من الجليد خلال فصل الصيف» ومن 
ناحية أخرىء» فإن المنطقة القطبية الجنوبية syle‏ عن قطعة من اليابسة 
محاطة بالمحيطء Liy‏ جليد البحر في المنطقة القطبية الشمالية يمتد إلى 
القطب الشمالي إلا أن الجليد في القطب الجنوبي أقل امتداداً للقطب الجنوبي» 
ونسبة كبيرة من الجليد في المنطقة القطبية الجنوبية تذوب كل صيفء وعند 
بلوغ مستوى الحد الأدنى السنوي في شهر lod‏ فإن الجليد في المنطقة 
القطبية الجنوبية ينخفض إلى نحو 2 مليون كيلومتر مربع» ويمتد إلى أقل من 
3 ملايين كيلومتر مربع؛ ملف البيانات Antarctic2.dta‏ يحتوي على بيانات 
عن متوسط امتداد الجليد خلال شهر فبراير (البيانات من دراسة Milke and‏ 
Heygster‏ 2009( وتغطي الفترة من 1972 إلى 2011( كما تتضمن البيانات 
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درجات الهواء السنوية غير العادية للمنطقة القطبية الجنوبيةء وهي تمتد من 
4 إلى 90 درجة جنوباًء والتي تم تقديرها بواسطة وكالة ناسا. 





.describe 
Contains data from C:\data\Antarctic2.Jta 
obs: 39 Antarctic February mean sea ice 1973-2011 Milke 
& Heygster 2009 
vars: 4 2 Jul 2012 06:11 
size: 429 
Storage display value 
variable name type format label variable label 
year int $8.0g Year 
yeargrp byte  $9.0g dec 1972-1999 v. 2000-2011 
extentS float %9.0g SH sea ice extent, million km^2 
tempS float %9.0g Annual air temp anomaly 645-905 C 


Sorted by: year 


هل الحد الأدنى لامتداد ada‏ البحر في المنطقة القطبية الجنوبية يميل 
نحو الازدياد أو النقص؟. انحدار 01:5 أوضح علاقة ضعيفة وليست ذات 
معنوية إحصائية لميله نحو التناقص (0.125 = م). 


.regress extentS year 





Source SS df MS Number of obs - 39 
F( 1, 37) = 2.46 

Model -480675664 1 .480675664 Prob > F = 0.1253 
Residual 7.22814772 37 54 R-squared - 0.0624 
Adj R-squared = 0.0370 

Total 7.70882338 38 .202863773 Root MSE = , 9 
extentS Coef. Std. Err. t P»|t| [95$ Conf. Interval] 
year -.0098642 .0062885 71.57 0.125 -.022606 .0028776 
cons 22.84955 12.52695 1.82 0.076 -2.532471 48.23156 





تناقص درجات الحرارة في المنطقة القطبية الشمالية كان واضحاً في 
الرسومات البيانية (الشكل 9.7 والشكل 12.7). الرسم البياني لتناقص 
درجات الحرارة في المنطقة القطبية الجنوبية في الشكل (4.8) لا يوضح 
اتجاهاً clia‏ حيث إننا لا نرى أي مشاكل إحصائية محتملةء القيم i ai yall‏ 
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للمتغير extentS‏ في سنتي 1972 3 1977( هي فترة كانت فيها مشاهدات 
الأقمار الصناعية JÍ‏ وضوحاء وربما تؤثر هذه المشاهدات على خط 
الانحدار» وتسبب في ميله السالب الضعيف. 

«predict exthati 


.label variable exthati "regress (OLS)' 
¿graph twoway  connectextentS  exthati year, 


msymbol(O +( 
صا‎ 
E 
+ 
b 
e 
e 
w 
5 mr tm i SQUE ESSERE LI E "T 
1970 1980 1990 2000 2010 
Year 
جه‎ SH sea ice extent, million km^2 ——— regress (OLS) 
(4.8) الشكل‎ 


الانحدار الموثوق يقاوم تأثير القيم المتطرفة» مما يجعل الانحدار 
الموثوق يتناسب مع الفحص السريع لمعرفة ما إذا كانت القيم المتطرفة لها 
تأثير غير مناسب على نتائج OLS‏ الأمر rreg‏ يقوم بحساب تحليل الانحدار 
الموثوق» وعند تطبيقه على جليد البحر للمنطقة القطبية الجنوبية اتضح بأن 
هناك انخفاضاً - ولكنه أقل حدة - وليس ذا معنوية. 


.rreg extentS year 
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Huber iteration 1: maximum differente in weights - .61809736 
Huber iteration 2: maximum difference in weights - .1095464 
Huber iteration 3: maximum difference in weights - .0319613 
Biweight iteration 4: maximum difference in weights - .23592582 
Biweight iteration 5: maximum difference in weights - .08565176 
Biweight iteration 6: maximum difference in weights - .02170203 
Biweight iteration 7: maximum difference in weights - .00318406 
Robust regression Number of obs - 39 
EC Ww. 37) = 1.62 
Prob » F = 0.2105 










extentS Coef. Std. Err. t P»|t| (95% Conf. Interval] 






-.0080677 .0063304 -1.27 0.210 -.0208943 . 0047588 
19.21456 12.61029 1.52 0.136 -6.336321 44.76544 





-cons 


بعد تطبيق الأمر rreg‏ يمكن للأمر predict‏ - بشكل gale‏ - الحصول 
على القيم المتوقعة. وتمثل هذه القيم المتوقعة بيانيا (والتي تسمى هنا 
2م ). الشكل )5.8( يقارن Lily‏ بين خط OLS‏ وخط OLS‏ الموثوق. 


.predict exthat2 

.label variable exthat2 "rreg (robust)' 

.graph twoway connect extentS exthati1 exthat2 
year, 

msymbol(O + i) lwidth(medium medium thick) 
legend(ring(0) position(12) col(1)) 


2 
9 هم‎ SH sea ice extent, million km^2 
——3——— regress (OLS) 

rreg (robust) 








25 


FT 


T Cmm: ا يه‎ EADEM ل‎ 
1970 1980 1990 2000 2010 
Year 


الشكل )5.8( 


الأمر rreg‏ يعمل بواسطة lie: yall‏ الصغرى الموزونة التكرارية 
(IRLS)‏ التكرار الأول rreg JAU‏ يبدأ مع OLS‏ وأي مشاهدات لها تأثير 
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كبير مثل أن قيم مسافة كوك لها Cook's D‏ أكبر من 1. فإن هذه المشاهدات 
سوف يتم استبعادها تلقائياً بعد الخطوة الأولى» ثم بعد ذلك يتم حساب الأوزان 
لكل مشاهدة باستخدام Alls‏ هوبر Huber function‏ (وهذه الدالة تقلل المشاهدات 
التي لها بواق كبيرة) ثم يتم حساب المربعات الصغرى الموزونة. بعد تكرار 
حساب المربعات الصغرى الموزونة عدة مرات» فإن دالة الترجيح أو الوزن 
سوف تنتقل إلى وزن توكي الثنائي Tukey‏ (تم الإشارة إلى هذا الوزن في 
دراسة Li‏ 1985(« ويتحول إلى توزيع جاوس بكفاءة 95,. (لمزيد من 
التفاصيل a‏ دراسة Hamilton‏ )19922((« الأمر rreg‏ يقوم بتقدير الأخطاء 
المعيارية ويختبر Latus caa gil‏ طريقة ة قيم وهمية لا تعتمد على فرضية 
التوزيع الطبيعي (انظر دراسة Street, Carroll and Ruppert‏ 1988). 
الأمر rreg‏ والأمر regress‏ كلاهما ينتمي لمجموعة مقذرات M-‏ 
(احتمالية الحد الأقصى (maximum‏ البديل الإحصائي الاستراتيجي لهذين 
الأمرين يسمى تقدير Cdi, L-‏ بشكل 345 مع ربيعات Vary‏ من cad i‏ 
3 متوسطات التقدير نفسه. فمثلا يمكننا إنشاء نموذج كيف أن الوسيط 
(الربيع 0.5( للمتغير ر يتغير مع المتغير or‏ الأمر qreg‏ )3^5 نوع من 
تقدیر (L1-‏ يقوم بحساب الانحدار الربيعي» الأمر qreg‏ يشبه الأمر Cus rreg‏ 
إنه يقاوم تأثير القيم المتطرفة. Lapac g‏ فإن الأمر greg‏ يميل ليكون أقل كفاءة 
elha ME‏ معيارية مرتفعة Ai js‏ مع الأمر rreg‏ وهذا هو الوضع هنا 
حيث إن الأمر qreg‏ وجد اه أخطاء معيارية os‏ الشكل 
(6.8) يقارن بيانياً بين النماذج الخطيّة الثلاثة. 
.qreg extentS year‏ 





Iteration 1: WLS sum of weighted deviations = 12.830409 


Iteration 1: sum of abs. weighted deviations = 14.282429 
Iteration 2: sum of abs. weighted deviations = 12.595795 


Iteration 3: sum of abs. weighted deviations 12.59334 

Median regression Number of obs - 39 
Raw sum of deviations 12.99536 (about 3.0977242) 
Min sum of deviations 12.59334 Pseudo R2 = 0.0309 











extentS : Std. Err. t P»|t| [95$ Conf. Interval] 





-.0056349 .0054759 -1.03 0.310 -.0167301 .0054604 


_cons 14.29918 10.9048 1.31 0.198 -7.796049 36.3944 





364 الإحصاء مع برنامج ستاتا 


.predict exthat3 

.label variable exthat3 "qreg (quantile)' 
.graph twoway connect extentS exthatí exthat2 exthat3 year, 
msymbol(O + i i) lwidth(medium medium thick medthick) 
lpattern(solid solid solid dash) legend(ring(0) position(12) col(1)) 
.graph twoway connect extentS exthatí exthat2 exthat3 year, 
msymbol(O + i i) iwidth(medium medium thick medthick) 
lpattern(solid solid solid dash) legend(ring(0) position(12) col(1)) 
.-graph twoway connect extentS exthatf exthat2 exthat3 year, 
msymbol(O + i i) lwidth(medium medium thick medthick) 
lpattern(solid solid solid dash) legend(ring(0) position(12) col(1)) 
.graph twoway connect extentS exthati exthat2 
exthat3 year, 

msymbol(O + i i) iwidth(medium medium thick 
medthick) 

lpattern(solid solid solid dash) 

legend(ring(0) position(12) co1(1)) 


uv 
Y 





SH sea ice extent, million km^2‏ له 
regress (OLS)‏ -—+—— 
rreg (robust)‏ —— 

qreg (quantile) 


1970 1980 1990 2000 2010 
1 Year 
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الوضع الافتراضي هو أن يقوم الأمر greg‏ بحساب الانحدار dia gl‏ 
ولكن هناك قدرات عامة أخرى لهذا الأمر» حيث إن هذا الأمر له القدرة على 
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حساب النماذج الخطيّة GY‏ ربيع من ربيعات المتغير cy‏ وليس فقط الوسيط 
(الربيع 0.5). فمثلاً الأمر أدناه وجد أن الربيع الثالث (الربيع 0.75) للمتغير 
extents‏ انخفض بطريقة ما بشكل أكبر من انخفاض الوسيط خلال الفترة 
الزمنية. الميل للربيع 0.75 يساوي 0.0149- وهذا يعني انخفاضاً بمقدار 
0 كيلومتر مربع في السنة مقارنة مع 5,600 “AS‏ في السنة للربيع 
5 أو الوسيط. وعموما فإن هذه النتائج ليست ذات معنوية إحصائية. 
.qreg extentS year, quant(.75)‏ 





Iteration 1: WLS sum of weighted deviations = 12.774128 








Iteration 1: sum of abs. weighted deviations = 12.877446 
Iteration 2: sum of abs. weighted deviations = 12.702146 
Iteration 3: sum of abs. weighted deviations = 12.323326 
Iteration 4: sum of abs. weighted deviations = 12.284196 
.75 Quantile regression Number of obs - 39 
Raw sum of deviations 12.70912 (about 3.4314537) 
Min sum of deviations 12.2842 Pseudo R2 = 0.0334 
extentS Coef. Std. Err. t P>|t| [95% Conf. Interval 






















-.0149048 
33.15648 


0.413 
0.361 


-0.83 
0.93 


.0179872 
35.83128 










-.0513504 
-39.4446 


.0215408 
105.7576 


بافتراض ثبات تباين الخطأء فإن ميول خطوط الربيعات 0.25 ,0.75 
يُقترض أن تكون هي نفسهاء وبالتالي فإن الأمر greg‏ يمكنه فحص اختلاف 
التباين heteroskedasticity‏ أو أنو اع بسيطة من عدم الاعتدال. 

loi‏ للأمر cregress‏ فإن الأمر rreg‏ والأمر qreg‏ يمكنهما العمل مع 
المتغيرات Agadi‏ (المحوّلة كلوغاريتمات أو ربيعات) والعمل مع أي عدد 
من المتغيرات التنبؤية Ley‏ في ذلك المتغيرات الوهمية أو التفاعلات؛ الكفاءة 
وسهولة الاستخدام بشكل gala‏ تجعل الأمر rreg‏ ذا قيمة للقيام بفحص عام 
وسريع لمعرفة ما إذا كانت نتائج الأمر regress‏ تأثرت بالقيم المتطرفة أو 
أخطاء التوزيعات غير الطبيعيةء وإذا تم تطبيق الأمر rreg‏ والأمر regress‏ 
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على نفس النموذج» سوف نحصل على نفس النتائج تقريبأًء ويمكننا تحديد 
استنتاجات بدرجة ثقة أكبر. Ud‏ إذا لم تتفق نتائج الأمر rreg‏ مع نتائج الأمر 
cregress‏ فإن ذلك يعتبر بمثابة علامة تنبيه بأن الاستنتاجات غير مستقرة 
وتحتاج إلى مزيد من التحليل لمعرفة أسباب الاختلاف»ء وتحديد كيفية التعامل 
مع هذه المشاكل الإحصائية. 

الاختلافات بين نتائج الأوامر regress, rreg, qreg‏ ليست كبيرة في مثال 
جليد البحر بالمنطقة القطبية الجنوبية. نتائج الأوامر الثلاثة جميعها تتفق بأن 
هناك علاقة ضعيفة وليست ذات Ala‏ إحصائية للميل نحو الانخفاض. الأمر 
regress‏ يعطي ميلاً أقل حدة في هذا الاتجاهء وذلك بسبب تأثره بالسنوات 
الأولى التي كانت قيمها مرتفعة. لهذا السبب فإن نماذج الأمر rreg‏ أو الأمر 
greg‏ قد تكون مفضتلة عن غيرهاء ولكن يمكننا السؤال عما إذا كان نموذج 
خط معقول في بداية التحليل» انحدار galai‏ المربعات الصغرى المرجحة 
والذي لا يفترض أي شكل عملي محدد يُعتبر أداة للإجابة عن الأسئلة من 
هذا النوع. عند تطبيق انحدار التجانس على بيانات جليد البحر بالمنطقة 
القطبية الشمالية (النتائج لن يتم عرضها هنا) فإن انحدار التجانس أظهر 
منحنى متشابهاً تماماً لذلك الذي أنتجه النموذج الربيعي في الفصل السابق 
بالشكل )12.7( LÍ‏ تطبيقه على جليد البحر بالمنطقة القطبية الجنوبية في 
الشكل (7.8) التالي فإن النتائج تشير إلى أنه لاشيء يتشابه مع النموذج 
الخطي أو النموذج الربيعي وبدلاً من ذلك فإن الانحدار المتجانس يعطي 
شرحاً نوعياً للانخفاض الأوّلي والارتفاع الذي عقب ذلك ثم ai ali‏ 
السنوات الأخيرة. الانخفاض الأولي هو الوحيد الذي يظهر al gu‏ واتقسيو 
ذلك هو وجود القدرة المحدودة للأقمار الصناعية في تسجيل التغيرات في 
تلك الفترة» وربما قد يكون نمط التغير في المدى الطويل سوف يكون أكثر 
وضوحاً في السنوات القادمة» ولكن هذا النمط ليس واضحا من البيانات 
الموجودة لدينا. 


.graph twoway connect extents year E lowess 
extentS year 
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: greg والأمر‎ rreg yo ly تطبيقات أخرى‎ 
Further rreg and qreg Applications 





الجزء «Soa‏ عرض تطبيقات مبستطة للأمر rreg‏ والأمر .qreg‏ هذه 
الأوامر يمكن استخدامها أيضاً بعدة طرق من الطرق السهلة إلى الطرق 
الأكثر تعقيداً. فمثلاً للحصول على فترة A‏ %90 لمتوسط متغير واحد مثل 
درجة حرارة الهواء في المنطقة القطبية الجنوبية (tempS)‏ يمكننا طباعة أمر 

.ci فترة الثقة‎ 
.ci tempS, level(90) 


Variable Obs Mean Std. Err. [90$ Conf. Interval] 


tempS 39 .3351282 .065531 .2246459 .4456105 

E‏ بدلاً من Ua; call‏ الحصول على نفس chu jll‏ وفترة الثقة من 
خلال تحليل انحدار بدون إدخال متغيرات o‏ الخيار nohead‏ يمنع ظهور 
ل O‏ كوك لس كه اة dn‏ 


.regress tempS, nohead level(90) 
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Coef. Std. Err. k P»|t| [90$ Conf. Interval 








-cons -3351282 .065531 5.11 0.000 .2246459 .4456105 


وبالمتثل» يمكننا الحصول على متوسط gi ga‏ 3( مع فترة ثقة 9690« 


الخيار nolog‏ يمنع ظهور سجل التكرار الموثوق وذلك توفيراً للمساحة. 
.rreg tempS, nolog level (90)‏ 


Robust regression Number of obs = 39 
F( 0, 38( = 0.00 
Prob » F = 










Coef. Std. Err. t P>|t] [90% Conf. Interval] 





-cons -318898 .0707103 4.51 0.000 .1996837 .4381124 


الأمر :qreg‏ يمكن استخدامه بنفس الطريقة للحصول على فترات i d‏ 
تقريبية لوسيط أو أكثرء مع ملاحظة أن الربيع 0.5 الذي تم الحصول عليه 
عن طريق الأمر qreg‏ قد لايكون مساوياً للوسيط. نظرياً الربيع 0.5 
والوسيط متساويان. وعمليا فإن الربيعات هي قيم تقريبية من القيم الحقيقية 
للعينة» حيث إن الوسيط يتم حسابه عن طريق .حساب متوسط القيمت-ين 
المركزيتين في البيانات في حالة أن مجموعة فرعية تحتوي على عدد زوجي 
من المشاهدات. لذا فإن وسيط العينة والربيع 0.5 يمكن أن يكونا مختلفين 
بطريقة لا تؤثر كثيراً على تفسير النموذج. 


-qreg tempS, nolog level(90) 


Median regression Number of obs - 39 
Raw sum of deviations 12.63 (about .28) 
Min sum of deviations 12.63 Pseudo R2 z 0.0000 


temps Coef. Std. Err. t P>|t| (90% Conf. Interval] 
_cons .28 .075718 3.70 0.001 .1523428 .4076572 


(0.335 بقليل من المتوسط العادي )0.319 مقابل‎ E aad dagli 


والربيع 0.5 يساوي )0.28( هو أيضا coil‏ مما يشير إلى وجود سنوات قليلة 
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شهدت ارتفاعاً في درجات الحرارة مما أدى إلى زيادة قيمة المتوسط. في 
الأوامر أعلاهء الخيار evel)‏ يحدد درجة الثقة المرغوبة» وإذا Link‏ بإهمال 
هذا الخيار» فإن ستاتا يقوم تلقائياً بحساب فترة ثقة 9695 

ولمقارنة المتوسطين يقوم المحللون باستخدام اختبار + للعينتين (ttes)‏ أو 
تحليل التباين في اتجاه واحد oneway)‏ أو (anova‏ وكما شاهدنا clla‏ يمكننا 
حساب اختبارات التعادل (وتؤدي إلى الحصول على إحصائية F‏ وإحصائية (t‏ 
وذلك من خلال تحليل انحدار المتغير الرقمي على متغير وهمي. المتغير 
الوهمي yeargrp‏ والذي يساوي 0 للفترة 1999-1972 ويساوي 1 للفتقرة 
2011-0 يقدم تفسيراً لذلك. الشكل )8.8( يعرض بيانياً درجات الحرارة 


غير العادية لهاتين المجموعتين. 
.graph box tempS, over(yeargrp)‏ 


1 1.5 


Annual air temp anomaly 645-905 C 
S 


0 





1972-9 2000-2011 


الشكل )8.8( 


تحليل الانحدار يؤكد الانطباع الذي حصلنا عليه من الشكل )8.8( حيث 
إن السنوات الأخيرة شهدت ارتفاعا ملحوظا في درجات الحرارة» وهذا 
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p Us Yl‏ ذو معنوية إحصائية )0.026 = «(p‏ متوسط درجات الحرارة غير 
العادية في المنطقة القطبية الجنوبية يساوي 0.239 درجة مئوية للفترة 
LÍ (1999-1992‏ للفترة 2011-2000 فإن المتوسط أعلى ب 0.312 
درجة مئوية )0.239 + 0.312 = 0.551 درجة مئوية)» وتجدر الملاحظة 
أنه حتى مع ارتفاع درجات الحرارة نصف درجة Ay gle‏ فإن المنطقة القطبية 
الجنوبية مازالت مكانا gL‏ جدا. ودرجات الحرارة سوف تستمر تحت 
الصفر لسنوات حول منطقة القطب الجنوبي. 


.regress tempS yeargrp, nohead 






[95$ Conf. Interval] 





.3115741 .1344639 2.32 0.026 .0391244 .5840237 
.2392595 .0745871 3.21 0.003 .0881314 .3903871 


yeargrp 
-cons 






ولكن» هل يمكننا الثقة في هذه النتيجة؟ الأمر rreg‏ أوضح أن 
المتوسطات الموثوقة أكثر اختلافا بقيمة قدرها 0.329 درجة مئوية» هذا 

(p = 0.023( الاختلاف ذو معنوية إحصائية‎ 
.rreg tempS yeargrp, nolog 


Robust regression Number of obs - 39 
F( 1, 37) 2 5.60 

Prob » F - 0.0233 

tempS Coef. Std. Err. t P»|t| [95% Conf. Interval] 







3290205 .1390096 2.37 0.023 .0473602 .6106807 
.2155881 -0771087 2.80 0.008 .0593511 3718251 


yeargrp 
_cons 





الأمر qreg‏ وجد أن الربيع 0.5 يختلف clos‏ حيث إنه يساوي 0.38 
درجة مئوية. هذا الاختلاف ليس ذا Ay gine‏ إحصائية )0.082 = «(p‏ وحيث إن 
هذه الاختلافات ليست ذات معنوية إحصائية بسبب زيادة الأخطاء المعيارية 
في تحليل الاتحدار الذي تم بالأمر careg‏ فإن هذا يؤدي إلى انخفأض 
إحصائية «c‏ أن زيادة الأخطاء المعيارية تعكس انخفاض كفاءة الأمر .qreg‏ 

.qreg tempS yeargrp, nolog 
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ABI pal‏ :: طرق ne‏ ا 


Median regression Number of obs - 39 
Raw sum of deviations 12.63 (about .28) 
Min sum of deviations 11.54 Pseudo R2 = 0.0863 











Coef. Std. Err. t P>|t| [95% Conf. Interval] 


.38 .137707 2.76 0.009 .1009791 -6590209 
.19 -079176 2.40 0.022 . 0295742 -3504257 


yeargrp 
_cons 


مع تأثير الترميزء وشروط التفاعل المناسبةء يمكن للأمر regress‏ تكرار 

تحليل ANOVA‏ بالضبط. Gus‏ إن استخدام الأمر regress‏ مع اتباعه بأوامر 
الاختبار المناسبة» سوف نحصل على نفس نتائج ۸ واختبار F‏ والتي يمكن 
الحصول عليها باستخدام الأمر anova‏ القيم المتوقعة التي يتم الحصول 
عليها من مثل تحليلات الانحدار هذه تساوي متوسطات المجموعة. ويمكن 
للأمر ol ya} rreg‏ تحليلات متماظة لاختبار الاختلافات في المتوسطات 
الموثوقة بدلاً من المتوسطات العادية. ويمكن استخدام الأمر qreg‏ بنفس 
النمط للحصول على احتمال ثالث لاختبار الاختلافات في قيم الوسيط. كل 
هذا يتيح لنا صياغة نماذج متشابهة مع تحليل التباين المتعدد N-way ANOVA‏ 
أو التغاير ANCOVA‏ مع تضمن الربيع 5 أو تقدير قيم التباين يندلا Bie‏ 
المتوسطات المعتادة. 

بغض النظر عن شكل توزيع الخطأء فإن OLS‏ تظل DOSES‏ غير متحيزء 
وفي الأمد الطويل» فإن تقديرات OLS‏ يُفترض أن تتمركز في قيم معلمية 
صحيحة. هذه الحالة لا تنطبق على أغلب المقدّرات الموثوقةء وإذا لم تكن 
الأخطاء متماظةء فإن خط الوسيط الذي تم إنشاؤه بالأمر greg‏ أو الخط ثنائي 
الوزن الذي تم إنشاؤه بواسطة الأمر rreg‏ نظرياً تتزامن مع خط ر المتوقع 
والذي تم تقديره بواسطة الأمر cregress‏ وطالما أن التواء الأخطاء يعكس 
جزءًا صغيرًا من توزيعهاء فإن الأمر rreg‏ قد يكون أقل تحيّزاً. ولكن عندما 
يكون الالتواء في التوزيع بالكامل» فإن الأمر rreg‏ سوف يقلل وزن le‏ 
واحد من النموذج» مما يؤدي إلى تقديرات تقاطع-ر متحيزة بشكل ملحوظ. 
تقديرات ميل الأمر rreg‏ تظل غير متحيزة بالرغم من الالتواء في توزيعات 
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الأخطاء. لذا هناك مفاضلة بين استخدام الأمر 6 أو ft‏ مشابه مع 
الأخطاء الملتوية. نحن نخاطر بالوقوع في تقديرات متحيزة لتقاطع -«رولكن 
يمكن توقع تقديرات دقيقة و غير متحيزة CIMA‏ الانحدار الأخرى. في 
العديد من التطبيقات مثل المُعَاملات هي أكثر إثارة للاهتمام إلى حد كبير من 
قالع Lan ye‏ يجمل المفاضكة d‏ حي Gaga y Jas‏ قاد اختبارات ty F‏ 
ليست مثل OLS‏ فهي Y‏ تفترض وجود الأخطاء الطبيعية. 


Nonlinear Regression — 1 : 1 — غير الخطي‎ Jus 


تحويل المتغيرات يسمح بإنشاء بعض العلاقات غيرالخطية باس تخدام 
تقنيات مألوفة للنماذج الخطية الحقيقية. ومن ناحية أخرىء فإن النماذج 
الخطية الحقيقية تتطلب مستوى آخر من التقنيات المتناسبة. الأمر nb‏ يقوم 
بحساب الانحدار غير الخطي بواسطة المربعات الصغرى المتعاقية. هذا 
الجزء يشرح مع الأمثلة التوضيحية للبياات الموجودة بالملف nonlin.dia‏ 


.use C:\data\nonlin.dta, clear 








s 
.describe 
Contains data from C:\data\nonlin.dta 

obs: 100 Nonlinear model examples (artificial data) 
vars: 5 2 Jul 2012 1 

size: 1,700 

storage display value 

variable name type format label variable label 
x byte %9.0g Independent variable 
yl float %9.0g yl = 10 * 1.03*x +e 
y2 float %9.0g y2 = 10 * (1 - .95*x) +e 
y3 float %9.0g y3 = 5 + 25/(1+exp(-.1*(x-50))) + e 
y4 float %9.0g y4 = 5 + 25*exp(-exp(-.1*(x-50))) + e 





Sorted by: x 


بيانات الملف nonlin.dta‏ تم إنشاوها مع متغيرات y‏ والتي 5 Cà‏ دوال 
غير خطيّة متنوعة للمتغير + زائدا أخطاء Qu gla‏ العشوائية؛ Sued‏ المتغير 1ر 
يمثل عملية النمو الأسّي 
yl = 10 x 1.03*‏ 
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تقدير هذه المعلمات من البيانات يمكن الحصول عليها باستخدام الأمر nl‏ 
yl = 1120 x 1.03*‏ 


وهو قريب بدرجة كبيرة من النموذج الصحيح. 
.nl (y1 = {b1=1}*{b2=1}4x)‏ 
















(obs = 100) 
Iteration 0: residual SS = 419135.4 
Iteration 1: residual SS = 416152.4 
Iteration 2: residual SS = 409107.7 
Iteration 3: residual SS = 348535.9 
Iteration 4: residual SS = 31488.48 
Iteration 5: residual SS = 27849,49 
Iteration 6: residual SS = 26139.18 
Iteration 7: residual SS = 26138.29 
Iteration 8: residual SS = 26138.29 
Iteration 9: residual SS = 26138.29 
Source | 55 df MS 
al eas ee Number of obs = 100 
Model 667018.255 2 333509.128 R-squared = 0.9623 
Residual 26138.2933 98 266.717278 Adj R-squared = 0.9615 
Root MSE = 16.33148 
Total 693156.549 100 6931.56549 Res. dev. = 840.3864 
yl Coef. Std. Err. t P»|t| [95$ Conf. Interval] 












11.20416 1.146683 9.77 0.000 8.928602 13.47971 
1.028838 . 0012404 829.41 0.000 1.026376 1.031299 





/b2 





الأمر predict‏ يقوم بحساب القيم المتوقعة والبواقي للنموذج غير الخطي 
الذي تم تقديره باستخدام الأمر 1م. الشكل )9.8( يعرض رسماً بيائياً للقيم 
المتوقعة من المثال السابق» موضحاً التناسب الأقرب ما بين النموذج 
والبيانات (۸=0.96). 


.predict yhat1 

¿graph twoway scatter yl x 
|| lime yhati x, sort 
|| , legend(off) ytitle("y1 = 10 * 1.03^x 
+ e)xtitle("x') 
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200 
حب 


y1 = 10 * 1.03^x + e 
100 150 


50 
1 








= z 
0 20 40 60 80 100 
(9.8) الشكل‎ 


Ya‏ من كتابة نموذج الأمر ail‏ يمكننا الحصول على نفس النتائج 
بطباعة الأمر التالي: 
.nl exp2: yi x‏ 
الخيار exp2‏ في الأمر corte}‏ يقوم باستخدام برنامج اسمه nlexp2.ado‏ 
والذي يُعرّف Alla‏ النمو الأسّي GIS‏ معلمتين. برنامج ستاتا يتضمن العديد من 
تلك البرامج لتطبيق الدوال التالية: 
3 ثلاث معلمات أسبّة: y=botb by‏ 
2 معلمتان أسيّتان: y= bib?‏ 
83 معلمتان أسيّتان سالبتان y-b(1 - bj)‏ 
4 أربع معلمات منطقيّة» by‏ تمثل مستوى البداية (both)‏ مقارباً للحد 
الأعلى الذي يساوي y-bytb(l-Fexp(-b4oc-53)))‏ 


3 ثلاث معلمات منطقية C jar‏ الصفر ورة تقارب للحد SI‏ 
مر 2 
y=b,/(it+exp(-b2(x-b3)))‏ 
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qnd‏ التق فلق الات ا ا يلك 


gom4‏ أربع معلمات لجومبرتز by Gompertz‏ تمشل مستوى البداية 
(both)‏ مقارب as‏ الأعلى yrbotbjlexp(-exp(-b(x-b3)))‏ 
gom3 `‏ ثلاث معلمات لجومبرتز «Gompertz‏ 145 من الصفر ورة ULE‏ 
للحد الأعلى y-b,exp(-exp(-bx(x-b;)))‏ 
يمكن للمستخدمين كتابة بر 3 أخرى nifimetion‏ خاصة بهمء كما يمكنك 
استخدام nlgom4.ado, nlexp3.ado‏ أو الأمثلة الأخرى oe‏ وللحصول على 
تفاصيل وشروحات عن كيفية تحديد وتقدير النماذج قم بطباعة الأمر help nl.‏ 


Nonlinear Regression — 2 : 2 — غير الخطى‎ just 


بيانات الجليد لشهر سبتمبر في المنطقة القطبية الشمالية (Arctic9.dta)‏ 
تعطي مثالاً حقيقياً. في الأمثلة السابقة» رأينا أن منطقة جليد البحر انخفضت 

في الفترة 2011-1979 وهي الفترة ill‏ يبة من مشاهداتٍ الأقمار الصناعية. 
الرسومات البيانية التشخيصية توضح alus Glas. sua‏ ولكق يشكل eua‏ 
وذلك بسبب أن الانخفاض كان أسرع من الوضع الخطي (الشكل 9.7 
والشكل 11.7)» النموذج الآخر للمنطقة القطبية الجنوبية أفضل ويشرح اتجاه 
المشاهدات خلال سنة 2011 (الشكل 12.7(« إذا تم توقع النموذج الربيعي 
لسنوات قليلة مقدماًء فإن اتجاهه يكون مستحيلاً old‏ حيث إنه سوف يصل 
للصفر بسرعة كبيرة» ويستمر ليكون سالباً. النماذج الفعلية تميل لإظهار 
انخفاض تدريجي حتى يصل هذا الانخفاض إلى الصفر (على سبيل المثال؛ 
انظر در اسة Wang and Overland‏ 2009(. النظير البسيط لمثل هذه النماذج 
الفعلية قد تكون منحنى S-‏ تماثلي» وهذا المنحنى مثل جومبرتز Gompertz‏ 
Ya‏ من الانخفاض السريع في التموذج الربيعي. 

الأوامر أدناه تعمل على نموذج جومبرتز ثلاثي المعلمات لجليد البحسر 
في المنطقة القطبية الشمالية. سوف نر كز على المتغیر extent‏ (المناطق التي 
بها جليد نسبته 9615 على الأقل) بدلاً من المتغير area‏ (المناطق التي بها 
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جليد 76100( والذي تم استخدامه سابقء وكما رأينا سابقاً في الشكل )14.3( 
فإن المتغيرين يسلكان نفس السلوك. 


.use C:\data\Arctic9.dta, clear 
.nl gom3: extent year, nolog 


(obs = 33) 







Source 
















Number of obs = 33 

Model 1425.43798 3 4 R-squared = 0.9957 
Residual 6.15941312 30 .205313771 Adj R-squared - 0.9953 
Root MSE = .4531156 

1431.5974 33 3 Res. dev. = 38.25858 


3-parameter Gompertz function, extent = bl*exp(-exp(-b2* (year - b3))) 


extent Coef. Std. Err. 2 P>|t] {95% Conf. Interval] 











7.580278 .291652 25.99 0.000 6.984645 8.175911 
-.0995915 .0271646 -3.67 0.001 -.155069 -.044114 
2017.531 2.173212 928.36 0.000 2013.093 2021.969 





/b2 


gisi‏ جومبرتز مناسب بشكل Cus coss‏ إن الثلاث معلمات ذات 
معنوية إحصائيةء المعلمة الأولى 7.58- bI‏ تعطي نقطة بداية تقريبية للنموذج 
وهي 8 مليون كم” . المعلمة الثانية b2=-0.0996‏ تتحكم في التغير في 
معدل الانخفاض. المعلمة الثالثة 03-2017,5 تعطي نقطة انقلاب التي عندها 
ينتقل المنحنى من الارتفاع (معدل انخفاض مرتفع) إلى محدب لأعلى (معدل 
انخفاض ضعيف) خلال سنة 2017. لتمثيل هذا النموذج بيانياً الشكل 
)10.8( يعرض القيم Aad gall‏ والتي تم توصيلها بواسطة منحنى وسيط 


.predict gomexti 
.graph twoway connect extent year 
B mspline gomexti year, band (50) 


lwidth(medthick) 
legend (1abel (1 "Observed extent") 
labei(2 "Gompertz prediction) 
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ان EOE‏ 


o 
1980 1990 2000 2010 
Year 





——9—— Observed extent Gompertz prediction 


الشكل )10.8( 


منحنى جومبرتز في الشكل )10.8( لا يبدو مختلفا عن المنحنى الربيعي 
a)‏ يتم عرضه هنا) ويتناسب يدرجة بسيطةء كما تنقصه زيادة طفيفة وغير 
واقعية في المنحنى الربيعي خلال السنوات الأولى» وعموما يبدو أن هناك 
اختلافات جوهرية تظهر عند استقراء نتائج منحنى جومبرتز خارج نطاق 
البيانات. 
وإذا افترضنا أننا نفكر في إضافة بيانات جديدة في التحليل ليشمل الفترة 
حتى سنة 0 - البيانات الواقعية لدينا تشمل حتى سنة 2011 - فإننا نبدأ 
بإضافة 19 مشاهدة إضافية لاتحتوي على بيانات الجليد» ولكن تحتوي على 
قيم السنة الجديدة فقط Aiu year‏ 2012 وحتى سنة 2030. الأمر الأول في 
الأوامر أدناه يحدد عدد المشاهدات وهو 52 (والذي كان 33(« الأمر الثاني 
يحسب قيم year‏ و هي تساوي السنة الماضية زائدا 1 لكل مشاهدة لاتوجد بها 
قيمة للسنة» وأخيرا نقوم بإعادة تقدير نموذج جومبرتز مع السنوات الجديدة 
.Set obs 52‏ 
.replace year - year[ n-1]41 if year--.‏ 


.Sort year 
.nl gom3: extent year, nolog 


الإحصاء مع برنامج ستاتا 


l 378 


(obs = 33) 







Source 


















Number of obs - 33 

Model 1425.43798 3 4 R-squared - 0.9957 
Residual 6.15941312 30 .205313771 Adj R-squared - 0.9953 
Root MSE = .4531156 

1431.5974 33 43.3817393 Res. dev. = 38.25858 


3-parameter Gompertz function, extent = bi*exp (-exp(-b2* (year - b3))) 












extent Coef. Std. Err. 8 P»|t| [95$ Conf. Interval 










7.580278 .291652 25.99 0.000 6.984645 8.175911 
-.0995915 .0271646 -3.67 0.001 -.155069 -.044114 
2017.531 2.173212 928.36 0.000 2013.093 2021.969 


/b2 





بالرغم من أن بيانات الجليد» وتركيبة النموذج لم تتغير» فإن البيانات 

الجديدة امتدت لتشمل سنوات إضافيةء مما يسهل عملية الحصول على قيم 
متوقعة لكل السنوات من 1979 وحتى 2030. 

.predict gomext2 

بخلاف القيم المتوقعةء فإن البواقي للمتغير 4 يتم حسابها للسنوات 

التي تحتوي على بيانات فقط. 
.predict res, resid‏ 
.Summarize res‏ 


Variable Obs Mean Std. Dev. Min Max 


res 33 .0000746 .4387273 -1.039796 1.137713 


الأوامر أدناه تستخدم القيم المتوقعة الجديدة (gomext2)‏ مع الانحراف 

المعياري للبواقي. الخيار (ed)‏ (تم تعريف النتائج بواسطة الأمر 

(summarize‏ يُستخدم لتحديد الحدو د العليا والدنيا لفترات الثقة #2sd‏ حول 

القيم المتوقعة. ثم بعد ذلك نقوم بإنشاء رسم بياني يعرض منحنى ج ومبرتز 
فترة الممتدة حتى 2030 مع التأكيد على التوقع الخاص بسنة 2012. 

.gen gomio = gomext2 -2*xr (sd) 

.gen gomhi = gomext2 +2*r (sd) 


“label variable gomext2 "nl gom3: extent year 
.label variable gomlo "Gompertz extent - 2sd' 
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الفضل cms‏ هة RPM ee‏ ا ا 


-label variable gomlo "Gompertz extent + 2sd' 
-graph twoway rarea gomlo gomhi year if year< 
2012, color(gsi13) 
|| mspline gomext2 year if year« 2012, 
bands(60) 
lwidth(thick) lcolor (maroon) 
|| mspline gomext2 year if year»- 2012, 
bands(60) 
lwidth(medthick) lcolor (maroon) 
lpattern(dash) 
|| connect extent year, lwidth(medthick) 
msymbol (0) 
lcolor (navy) mcolor (navy) 
|| scatter gomext2 year if year -- 2012, 
msymbol (S) 
mcolor (maroon) 
|| if year>1978, xlabel (1980 (5) 2030, grid) 
yline(0, lcolor(black)) 
yline(1, lcolor(gsi1) lwidth (thick) ) 
xtitle("") legend(order(4 2 1) label(2 
"Gompertz curve") 
label(4 "NSIDC extent") label (1 
"“schar(177)' 2sd") 
position(7) ring(0) col(1)) 
text(4.5 2019 "2012 Gompertz" "prediction" 
"4.3 (3.4°=char(150)'5.1)", color (maroon)) 


eo 


2012 Gompertz 
prediction 
NC 4.3 (3.4-5.1) 
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فترة الثقة التي تظهر باللون ن الرمادي الفاتح في الشكل )11.8( تم 
إنشاؤها أو E‏ وقام الأمر twoway rarea‏ (مدى الفترة) بالتمثل البياني 
للسنوات ما قبل 2012» ثم بعد ذلك تم إنشاء منحنى متوسط ذي لون أحمر 
داكن (mspline)‏ يمثل القيم المتوقعة لجومبرتز للفترة ما قبل 2012 وتم 
وضع هذا المنحنى فوق فترة الثقة الرمادية. بعد ذلك تم وضع قيم المتغير 
4 في الشكلء وتم تمثيلها Lay‏ متصل (connect)‏ الخطوة الخامسة 
pipi ee‏ تيت فال mn m‏ ة تمثل القيم 
المتوقعة LÍ .2012 Aiud‏ النتصوص الموجودة في الرسم فهي تحدد القيمة 
الرقمية وحدود فترة الثقة لهذا التوقع» وكان لون الخط الخاص بالنصوص في 
الرسم البياني أحمر itn‏ وهی قن call ia cul‏ المتوقعة» هناك Laj‏ 
خط أفقي رمادي عند نقطة 1 مليون (yline(1)) ^S‏ تمثل المستوى المنخفض 
للجليد خلال شهر سبتمبرء والذي يُعتبر فترة خالية من الجليد. 

يجب التأكيد على أن منحنيات التنبؤ بهذا النمط لاتمثل طريقة موثوقة 
لتوقع المستقبل. وهذا النموذج بالذات لا يعطي فهماً مادياً لما سوف يحدث 
فمثلاً لا يعطي ماهو سبب انخفاض الجليدء فهذا يعتمد بالكامل على اختياراتنا 
الأولية للمتغيرات في النموذج الإحصائي» وكيف تتناسب هذه المتغيرات مع 
البيانات التاريخية؛ وكتطبيق إحصائي يمكننا os‏ هذه التوقعات البسيطة 
خطوة أخرىء المنحنى في الشكل (11.8) يذ ينخفض إلى أقل من 1 مليون كم2 
في سنة 2025 معطياً نقطة توقع عملية للمناطق الخالية من الجليد في 
المنطقة القطبية الشماليةء ولكن حتى ولو ظهر أن نموذج جومبرتز إلى حد 
ما quss‏ فإننا يجب أن نتوقع gh‏ السلوك الواقعي لهذا المنحنى يتغير كما 
حصل في الماضي. 

بافتراض أن التباين حول المنحنى للسنوات القادمة يتبع التوزيع الطبيعي 
مع بعض الانحراف المعياري الذي يظهر في المنحنى في الفترات الماضية 
فإنه يمكننا محاكاة مثل هذا السلوك بإضافة تذبذب إلى منحنى التجانس 
ee at‏ ا واي اوی يولي 
الفترات الماضية. فمثلا الأوامر أدناه تقوم بإنشاء مجموعة جديدة من القيم 
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م EE Se‏ 
المتوقعة (gomext3)‏ زائداً تذبذبات طبيعية عشوائية مع الانحراف المعياري 
للبواقي (r(sd)‏ بعد الأمر summarize res‏ وإذا كان التنبؤ الجديد يشير إلى 
dalla coda‏ رهی تفيل Vidi‏ فإننا نعدل القيمة لتكون lina‏ فقط وليست 


أقل من ذلك. 
.quietly summ res‏ 
.gen gomext3 - gomext2 + r(sd)*rnormal()‏ 
replace gomext3 = 0 if gomext3« 0‏ 
.replace gomext3 - extent if year -- 2011‏ 
الأوامر أدناه سوف تقوم بإنشاء رسم بياني للنتائج بطريقة مشابهة للشكل 
(10.8). 


.graph twoway rarea gomlo gomhi year if year< 
2012, color(gs13) 
|| mspline gomext2 year if year< 2012, 
ands (60) 
lwidth(thick) lcolor (maroon) 
|| mspline gomext2 year if year»- 2012, 


bands(60) 

lwidth(medthick) lcolor (maroon) 
lpattern(dash) 

|| connect extent year, lwidth(medthick) 
msymbol (O) 


lcolor(navy) mcolor (navy) 

|| line gomext3 year if year>= 2011, 
lwidth(medthick) 

lcolor (midblue) 

E. s xlabel(1980(10)2030, grid) 
yline(0, lcolor(black)) yline(1, 
lcolor(gsi1) lwidth(thick) ) 
ylabel(0(1)8) ytitle("") xtitle("") 
legend(order(4 2 1 5) label(2 "Gompertz 
curve") 

label(4 "NSIDC extent") label(i 
"'zchar(177)' 2sd") 

label(5 "simulated") position(7) ring(0) 
col(1) rowgap(*.3)) 
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Gompertz extent simulation: some possible future paths 
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الشكل )12.8( 


في كل مرة نقوم بها بإدخال الأوامر أعلاه» سوف نحصل على قيم 
متذبذبة عشوائية مختلفةء وبالتالي رسم بياني مختلف. الشكل )12.8( يجمع 
أربعة أشكال بيانية في شكل واحد يساعد في التأكيد على الانحراف غير 
المتوقع من سنة لأخرى. امتداد الجليد في أي سنة قد يرتفع أو ينخفض» 
وحيث إن المنحنى يعرض متوسط التغيرات» فمن غير المتوقع أن تتطابق 
هذه الأشكال. 

أحياناً الرسومات البيانية المنشورة تبقى لفترة طويلةء ويتم تداولها 
لأهداف لم ينو الكاتب القيام بهاء واستخدامها بدون علم الكاتب نفسه. ل ذلك 
فإنه من الأفضل أن تقوم بوضع اسمك» ومصدر البيانسات» وأي معلومات 
إيضاحية أخرى على الرسم البياني نفسه؛ LS‏ هو واضح في الشكل )12.8( 
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a es‏ 
باستخدام ccaptiony note GI LAM‏ الأمر أدناه يقوم بدمج أربعة أشكال في 
صورة واحدة Gompertz extent] Viu e‏ و Gompertz extent2‏ و هكذا. 


-graph combine Gompertz_extent1.gph 
Gompertz_extent2.gph : 
Gompertz_extent3.gph Gompertz_extent4.gph, 
title("Gompertz extent simulation: some 
possible future 
paths", size(medlarge) ( 
caption("data through 2011: NSIDC") 
note("graph: L Hamilton 6/21/2012") 
imargin(small) co1 (2) 
lititle("September sea ice extent, million 
km` =char (178) '") 


Box-Cox Regression : بوئس ^ كوتس‎ Jus 





نترك بيانات المناطق الباردة خلفناء ونبدأ بالعمل على بيانات التنمية 
البشرية للأمم المتحدة في بقية هذا الفصل. هذه البيانات موجودة بالملف 
eWations3.dta‏ العلاقات غير الخطية بين المتغيرات واضحة في أشكال 
الانتشار لهذه البيانات» وهذه الأشكال مغل الشكل )4.7( اللوغاريتمات | 
وطرق التحويل الأخرى من Sst alu‏ للقوى Tukey's ladder‏ (تم الإشارة 
إليه في الفصل 5) تعتبر أدوات بسيطة تجعل العلاقات غير الخطية أكشر 
خطية» مما يُمكننا من تطبيق 5 والانحدار الموثوق والنماذج الخطية 
الأخرى 

اختيار استخدام أي طريقة تحويل قد يتضمن محاولة عدة خيارات 
واختبار كيف. إن كل خيار يؤثر في التوزيعات وأشكال الانتشار والبواقي. 
هناك مدخل منهجي يُسمى انحدار بوكس - كوكس بدلا من استخدام تقدیر 
الأرجحية العظمى لاختيار معلمات تحويل بوكس - كوكس التي تعتبر أفضل 
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نموذج انحدار معين. تحويل بوكس - كوكس الأكثر استخداما يتم تطبيقه 
على كل المتغيرات في النموذج أو أي مجموعة فرعية من المتغيرات. 

ial,‏ على سبيل المثال انحدار متوسط العمر المتوقع على ستة 
متغيرات أخرى تتضمن reg]‏ ومتغير وهمي يتم. إنشاؤه عن طريق الأمر 
tabulate‏ والذي يُشير إلى الدول الأفريقية. 


.use C:\data\Nations3.dta, clear 
.describe life adfert urban gdp chldmort school 





regi 
storage display value 
variable name type format label variable label 
life float %9.0g Life expectancy at birth 2005/2010 
adfert float 58.09 Adolescent fertility: births/1000 fem 15-19, 2010 
urban float %9.0g Percent population urban 2005/2010 
gdp float %9.0g Gross domestic product per cap 2005$, 2006/2009 
chldmort float %9.0g Prob dying before age 5/1000 live births 
2005/2009 
school float %9.0g Mean years schooling (adults) 2005/2010 
regl byte %8.0g regl region==Africa 


ليست هناك فائدة في تحويل متغير ثنائي القيم مثل reg?‏ ولكن شكل 
الانتشار للمتغيرات الأخرى يعرض أنماطاً غير خطية تجعلها مرشحة 
للتحويل. في هذا المثالء نقوم بتحليل انحدار المتغير 1# على المتغيرات 
cadfert, urban, gdp, chldmort, school, reg]‏ المتغير المستقل أو متغير 
الطرف الأيسر هو life‏ والذي يكون في العادة في شكل صف» ولكن التحويل 
مطلوب لكل المتغيرات في الطرف الأيمن باستثناء المتغير regl‏ هذه 
الاختيارات يمكن القيام بها باستخدام الخيارات model(rhsonly)‏ 
«notrans(reg])‏ ويجب ملاحظة أن قائمة المتغيرات الأو لية لاتتضمن 
المتغير reg]‏ حيث تم تحديده بشكل منفصل في الخيار notrans()‏ 


.boxcox life adfert urban gdp chldmort school, 
model(rhsonly) notrans(reg1) 
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Fitting full model 


Iteration 0: log likelihood = -455.39883 (not concave) 
Iteration 1: log likelihood = -430.26519 
Iteration 2: log likelihood = -429.92904 
Iteration 3: log likelihood = -429.92798 
Iteration 4: log likelihood = -429.92798 


(15 missing values generated) 
(1 missing value generated) 
(6 missing values generated) 
(15 missing values generated) 
(1 missing value generated) 
(6 missing values generated) 
(15 missing values generated) 
(1 missing value generated) 
(6 missing values generated) 
































Number of obs = 178 
LR chi2(7) = 463.38 
Log likelihood = -429.92798 Prob > chi2 = 0.000 
life Coef. Std. Err. x P»|z| [95$ Conf. Interval 
/lambda .4867359 .0513717 9.47 0.000 3860492 .5874226 
Estimates of scale-variant parameters 
Notrans 
regi -2.863907 
—cons 86.17721 
Trans 
adfert -.0383667 
urban .2065436 
gdp .000283 
chldmort -1.42784 
school -1.601755 
2.708479 
Test Restricted LR statistic P-value 
H0: log likelihood chi2 Prob » chi2 
lambda - -1 -524.20312 188.55 0.000 
lambda = 0 -476.81642 93.78 0.000 
lambda - 1 -455.39883 50.94 0.000 
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قيمة (lod)‏ المعطاة في جدول المخرجات أعلاه )04867359 = (A‏ هي 

المعلمة المختارة للشكل العام لتحويلات بوكس - كوكس 
X9 = 2-1‏ 
edule’‏ الانحدار المعروضة في جدول مخرجات بوكس = كوكس 
أعلاه تتعلق بانحدار ale‏ لمتغيرات تم تحويلها في هذا النمطء بالإمكان 
متغير ثم استخدام الأمر -regress‏ 

.gen bc2adf = (adfert^.4867359-1)/.4867359 

.gen bc2urb = (urban^.4867359-1)/.4867359 

.gen bc2school = (school^.4867359-1)/4867359 

.gen bc2gdp = (gdp^.4867359-1)/.4867359 


.gen bc2chld = (chldmort^.4867359-1)/.4867359 
.regress life bc2* regi 








Source 

































Number of obs - 178 

F( 6, 171) = 356.47 

Model 16332.407 6 2722.06783 Prob» F - 0.0000 
Residual 1305.78282 171 7.63615683 R-squared - 0.9260 
Adj R-squared = 0.9234 

17638.1898 177 99.6507898 Root MSE - 2.7634 


life Coef. Std. Err. t P»|t| [95$ Conf. Interval] 





bc2adf -.0383667 .0598489 -0.64 0.522 -.1565045 .0797711 
bc2urb .2065436 .0955322 2.16 0.032 .0179693 .395118 
bc2school -1.60e+07 3209717 -4.99 0.000 -2.24e407 -9681777 
bc2gdp .000283 .0035913 0.08 0.937 -.006806 .0073721 
bc2chld -1.42784 .0792446 -18.02 0.000 -1.584263 -1.271416 
regi -2.863907 .674814 -4.24 0.000 -4.195945 -1.531869 
—cons 86.17721 1.909628 45.13 9.000 82.40773 89.94669 





انحدار بوكس - كوكس وجد أن معلمة التحويل ۸ هي الأمثل في سياق 
معيار الأرجحية العظمى. مقابلة متطلبات هذا المعيار لا تعني بالضرورة أن 
العلاقات أصبحت خطية. الهدف الأخير - وهو جعل العلاقات خطية - ربما 
من الأفضل استمرار محاولة القيام به من خلال استخدام الفحصص المرئي 
والحكم الشخصي مع احتمالية استخدام تحويلات مختلفة للمتغيرات. 
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الفضل ee‏ ر ا س 


الإسناد اطتعدد للقيم اطفقوده : 


Multiple Imputation of Missing Values 


ملف البيانات Nations3.dta‏ يحتوي على معلومات عن 194 Aga‏ ولكن 
القيم المفقودة تقيّد التحليل الذي قمنا به في الجزء السابق ليكون التحليل 
لمجموعة فرعية مكونة من 178 دولة لها معلومات متكاملة لكل المتغيرات. 
مدخل قائمة الحذف الذكية لاستبعاد القيم المفقودة وهي ممارسة إحصائية 
شائعة بدافع الضرورة ومن عيوبها Ady wall‏ خسارة aay‏ المشاهدات؛ 
ونقص القوة الإحصائيةء وإذا كانت المشاهدات ذات القيم المفقودة تختدف 
بدرجة كبيرة عن باقي المشاهدات» فإن قائمة الحذف الذكية قد تؤدي إلى 

تحيّز المُعَاملات المقذرة 

قد تكون هناك متغيرات أخرى في البيانات التي ترتبط إحصائياً بالقيم 
المفقودة. في مثل هذه الحالات» فإن الانحدار يمكن أن يُستخدم لتوقع ماهي 
القيم المفقودة وهذه التوقعات تستخدم كبديل للقيم المفقودة في خطوات تحليلية 
تالية. إسناد الانحدار للقيم المفقودة يمكنه استعادة المشاهدات والقوة 
الإحصائية الظاهرية» وتقليل احتمالية الحصول على مُعاملات متحيّزة 
وعموماً فإن القيم المُسندة سوف يكون لها تباين منخفض عن تلك القيم 
الموجودة GY‏ متغير» مما يؤدي إلى تقديرات خطأ معياري متحيزة HG‏ 
من الصفر. بعبارة أخرى إسناد الانحدار قد يتسبب في الحصول على 
تقديرات مبالغ فيها في الدقة أو المعنوية الإحصائية للنتائج المحسوبة. 

الإسناد المتعدد للقيم المفقودة يبدأ من الفكرة الأساسية لإسناد الانحدار ثم 

تتم إضافة خطوات أخرى للحصول على تقد تقديرات واقعية للأخطاء المعيارية 
أو عدم التأكد. هذه الخطوات تتضمن إنشاء مجموعات متعددة من المشاهدات 
Ayan gi‏ تم كبديل للقيم المفقودة» وذلك عن طريق توقعات الانحدار زائداً 
تذبذبات عشوائية. ثم الخطوة الأخيرة هي جمع معلومات الإسناد المتعدد 
لتقدير نموذج الانحدار مع أخطائه المعيارية واختباراته. 


مجموعة أوامر ستاتا mi‏ لإجراءات الإسناد المتعدد تدعم ae‏ من طرق 
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اللوغاريتمية للمتغيرات النوعيةء دليل المستخدم Staia Multiple-Imputation‏ 
Reference Manual‏ يغطي هذا الخيارات» بالإضافة إلى عدد آخر إضافي 
يحتوي على أمثلة ASÍ‏ تعقيدا. 

وكمثال chuy‏ يمكننا العودة al‏ تحليل انحدار متوسط العمر المتوقع. 


.use C:\data\Nations3.dta, clear 
.regress life adfert urban loggdp  chldmort 
school regi 
























Source Number of obs - 178 
F( 6, 171) = 246.57 

Model 15810.6966 6 2635.1161 Prob > F = 0.0000 
Residual 1827.49317 171 10.6870946 R-squared = 0.8964 
Adj R-squared = 0.8928 

17638.1898 177 99.6507898 Root MSE - 3.2691 
















life Coef. Std. Err. t P>|t| [95% Conf. Interval] 











.0039441 .0091498 0. -.0220053 .014117 

urban .0397506 .016287 2.44 0.016 .0076012 .0718999 
loggdp 2.90728 .9196223 3.16 0.002 1.092007 4.722554 
chldmort -.1314439 .0102063 -12.88 0.000 - 55 -.1112972 
School -.3322321 .1480558 -2.24 0.026 -.6244844 -.0399798 
regi -3.56938 . 7845902 -4.55 0.000 -5.118109 -2.02065 
65.3779 3.124978 0. 59.2094 71.5464 






هناك ثلاثة متغيرات في هذا التحليل — loggdp, chldmort, school‏ - بها 
قيم cba side‏ وهذه المتغيرات مجتمعة تؤدي إلى انخفاض مشاهدات العينة من 
4 إلى 178 مشاهدة. 


.Summarize life adfert urban loggdp chidmort 
school regi 


Variable 

















life 68.7293 10.0554 45.85 82.76666 


adfert 194 51.81443 44.06612 1 207.1 
urban 194 55.43488 23.4391 10.25 100 
loggdp 179 3.775729 .5632902 2.446848 4.874516 
chldmort 47.65026 52.8094 2.25 209 











7.45922 2.959589 
194 .2680412 .4440852 0 1 





regl 
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اك ا $A‏ 
الأمر misstable summarize‏ يحسب ثلاثة أنواع من المشاهدات es‏ 
على حالة القيم المفقودة لتلك المشاهدات: 
obs-.‏ القيمة المفقودة الافتراضية لبرنامج ستاتاء وشار إليها 
ب "المفقود الناعم". 
TII exl 554) obs».‏ كحروف مع نقاط مثل b, a‏ ,ه. «dl‏ 
ويمكن إضافة توصيف لهاء ويُشار إليها ب "المفقود الخشن". 
.> قيم موجودة. 
يمكن لبرنامج ستاتا إدخال قيم مفقودة ناعمة فقط» ولا يمكنه إدخال 
القيم الخشنة. وتجب الإشارة إلى أن جميع القيم المفقودة في ملف البيانات 
Nations3.dta‏ هي من النوع الناعم» ولذلك فإن الوضع أسهل. وهناك مثال 
لدراسة أستقصائية تحتوي على قيم خشنة سوف يتم تناوله في الفصل (9). 


.misstable summarize life adfert urban loggdp 
chldmort school regi 


(UN Human Development Indicators) 


. misstable summarize life adfert urban loggdp chldmort school regi 
Obs«. 















Unique 
Variable values Min Max 
179 2.446848 4.874516 
144 2.25 209 
1445 12.7 


loggdp 
chlidmort 





الخطوة الأولى في الإسناد المتعدد هي تحديد البيانات باستخدام الأمر 
cmi set‏ والذي يحدد كيف يتم تنظيم القيم المدخلة. هناك أربع طرق محتملة 
as‏ شرحها في دليل المستخدم Reference Manual‏ — ففي Lillis‏ الحالي سوف 
نختار طريقة الذاكر 3 anlong ibil‏ حيث إن المشاهدات الجديدة أو 
الصفوف سوف تضاف للبيانات. 


.mi set mlong 
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عند تسجيل الإسناد المتعددء فإن القيم المفقودة في البيانات الأصلية غير 
المُسندة سوف تسجل على أنها an-0‏ عمليات الإسناد مع مجموعات من القيم 
التي تم إدخالها كقيم مفقودة تسجل على أنها 1= ,2 - ”,3= mm‏ وهكذاء حرف 
M‏ يشير إلى axe‏ عمليات الإسناد التي تم القيام بها. وقبل التقدم أكتر نحن 
نحتاج إلى تسجيل المتغيرات التي نريد إسنادها في واحد من الأنواع الثلاثة 
التالية: 
imputed‏ المتغير له قيم مفقو دة تحتاج إلى إسناد. 


passive‏ متغير وهو عبارة عن Alla‏ للمتغيرات المسندة أو Alla‏ لمتغيرات 
cala‏ وهذا المتغير سوف تكون له قيم مفقودة في البيانات 
الأصلية (m0)‏ وقيم متفاوتة لكل إسناد )1 m 22 «an‏ وهكذا). 
Y regular‏ المتغيرات المسندة ولا السلبية تكون لها نفس القيم» (المفقودة 
أو الموجو دة) لكل m‏ 
مثالنا الحالي له قيم مفقودة بالمتغير ات Joggdp, chldmort, school‏ لذلك 
تم تسجيل هذه المتغيرات كمتغيرات مسندة imputed‏ 
.mi register imputed loggdp chldmort school‏ 
المتغيرات الأخرى life, adfert, urban, reg]‏ لا تحتوي على ad‏ مفقودة» 
ويجب أن dius‏ كمتغيرات منتظمة regular‏ 
.mi register regular life adfert urban reg1‏ 
الخطوة التالية تقوم بالإسناد الفعلي» والقيم المفقودة للمتغيرات loggdp,‏ 
chldmort, school‏ (متغير (mi register imputed!‏ يتم إسنادها عن طريق 
انحدار متغيرات s mi register regular‏ هي creg], adfert, urban‏ سوف 
نستخدم طريقة الانحدار الطبيعي متعدد المتغيرات (mvn)‏ وسوف os‏ هناك 
Du 0‏ مستقلا يُشار إليها ك 7-0 (وهي البيانات الأصلية التي تحتو 
على قيم مفقودة) أو m-l‏ وحتى m=50‏ وکل منها تحتوي على إسنادات at‏ 
16 مشاهدة كانت أصلا Les‏ مفقودة في PEN‏ الأمسلية. لتاقن 
800=16%50 مشاهدة سوف تضاف إلى البيانات» مما يجعل مجموع 
المشاهدات 964-800+194 مشاهدة. 


الفصل الثامن : طرق الانحدار المتقدمة 391 





-mi impute mvn loggdp chldmort school = adfert 
urban regi, add(50) rseed(12345) 


Performing EM optimization: 
Observed log likelihood - -780.80745 at iteration 6 


Performing MCMC data augmentation ... 


Multivariate imputation Imputations - 50 
Multivariate normal regression added - 50 
Imputed: z-1 through 7-50 updated - 0 
Prior: uniform Iterations - 5000 
burn-in - 100 
between - 100 






Observations per 7 








Variable Total 





Complete Incomplete Imputed 









loggdp 
chldmort 
school 


194 
194 


(complete + incomplete = total; imputed is the minimum across m 
of the number of filled-in observations.) 


الحصول على 50 قيمة مُسندة مستقلة كل منها تحتوي على قيم مفقودة 
تم استبدالهاء هذا يوفر قاعدة للتقديرات التي سوف نقوم بها لاحقا للاختلافات 
من عينة لأخرى عند قيامنا بجمع هذه القيم للانحدار. الخيار rseed(12345)‏ 
في الأمر mi impute‏ يقوم بتحديد نظام اختياري لمولد الأرقام العشوائية 
ببرنامج ستاتا. يمكننا إنشاء مثال قابل للتكرار عن طريق استخدام الخيار 
crseed()‏ وهذا المثال قد يكون مقبولاً لأهداف تعليمية. غير ذلك» فإن ستاتا 
سوق يخقاز الضبط Gal‏ به Gas‏ أختلافات بسيظة قي النتائج عة 
استخدام الأمر في المرة التالية. 

الخطوة الأخيرة تستخدم هذه الإسنادات لتحليل انحدار متغير متوسط 
العمر المتوقع على 6 متغيرات تنبؤية. مبدئياً فإن عملية الإسناد تؤدي إلى 
تقديرات أكثر كفاءة (أخطاء معيارية منخفضة) وتقلل من التحيّز عند تحليل 
الانحدار الذي استبعد كل المشاهدات التي تحتوي على قيم مفقودة. 


392 الإحصاء مع برنامج ستاتا 


emi estimate, dots: regress life adfert urban 
loggdp chldmort school regi 


Imputations (50): 


— عار اماه‎ s 10 ise «420... 430... 5.400... 50 done 
Multiple-imputation estimates Imputations - 50 
Linear regression Number of obs = 194 

Average RVI = 0.0365 

Largest FMI = 0.1167 

Complete DF = 187 

DF adjustment: Small sample DF: min = 156.85 
avg = 172.10 

max = 184.02 

Model F test: Equal FMI F( 6, 184.7) = 240.19 
Within VCE type: OLS Prob > F = 0.0000 
life Coef. Std. Err. t P>|t] [95% Conf. Interval 

adfert -.0044855 -0091363 -0.49 0.624 -.0225124 .0135414 

urban .047157 .0163199 2.89 0.004 .014945 .079369 

loggdp 2.704804 . 9755022 2.77 0.006 7779876 4.63162 
chldmort -.1305611 .0102536 -12.73 0.000 -.1507939 -.1103283 
school -.3317234 .1527427 «2.17 0.031 -.6332567 -.0301902 

regl -3.814368 .8011135 -4.76 0.000 75.394917 -2.23382 

cons 65.78153 3.297027 19.95 0.000 59.27041 72.29265 





نتائج الأمر mi estimate‏ تشبه بدرجة كبيرة تلك التي حصلنا عليها من 
تحليل الانحدار العادي» هذا يمثل أفضل سيناريو تتشابه فيه الطرق المعقدة 
والبسيطةء حيث إن النتائج تظهر مستقرة بشكل معقول. وفي أي تقرير بحثي 
يمكننا عرض التحليل مع الملاحظات التوضيحية لتوضيح أننا اس تخدمنا 
مدخلاً آخر للاختبار» lias‏ على نفس النتيجة. 

الفصل )9( يوضح مثالاً ثانياً للإسناد المتعدد باستخدام بيانات دراسة 
استقصائية بدلا من نماذج الانحدار الخطية. وللحصول على مزيد من 
التفاصيل عن هذا الموضوع قم بطباعة الأمر help mi‏ أو الاطلاع على دليل 
المستخدم -Stata Multiple-Imputation Reference Manual‏ 


Structural Equation Modeling : مادج اطعادلة الهيكلية‎ 


نماذج الانحدار السابقة تعاملت مع خصوبة المراهقين» والنسبة المئوية 
للمناطق الحضرية»ء والخصائص المحلية الأخرى كمتغيرات تنبؤية محتملة 
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لمتغير متوسط العمر المتوقع بدون ضرورة التأكيد على أن هذه المتغيرات 
في مسببات لمتوسط العمر المتوقع. أحد هذه المتغيرات التنبؤية هو متغير 
معدل وفيات الأطفال والذي كانت له علاقة سببية بمتوسط العمر المتوقع» 
ولكن معدلات وفيات JULY!‏ بدورها خاضعة للتأثر بالخصائص المحلية 
الأخرى مثل ماهو العمر المتوقع مما يجعل العلاقة السببية أكثر تعقيداً. فعلى 
سبيل المثال» إذا كانت معدلات الخصوبة لدى المراهقين تؤثر على وفيات 
الأطفال ووفيات JULY!‏ تؤثر على متوسط العمر المتوقع؛ OY‏ فإن خصوبة 
المراهقين لها تأثير غير مباشر على متوسط العمر المتوقع وما إذا كان 
متوسط المتوقع له تأثير مباشر واضح. وفي سياق العلاقة السببية» فإن معدل 
وفيات الأطفال يعمل كمتغير وسيط أو دخيل. 

نماذج المعادلة الهيكلية تعتبر طريقة منتظمة لتحليل مثل هذه التأثيرات 
غير المباشرة مع الأنواع الأخرى للعلاقات aal‏ وتوضيح هذه النماذج 
يظهر في الرسم البياني للمسار الذي يعرض بعض الأفكار حول الترتيب 
والعلاقات السببية. الترتيب السببي للمتغيرات أمر مهم جداً. . ونموذج المعادلة 
الهيكلية لايمكنه إثبات السببية» ولكن يفترض هيكلاً سببياً معينا ثم ibe}‏ عليه 
التقنيات الإحصائية لعرض التفاصيل وتطوير المحددات بطريقة ما. يجب 
علينا الاعتماد على المعرفة الخارجية أو النظرية لتحديد الترتيب السببي 
البسيط. وإذا كانت المعرفة ضعيفة» فإن التحليل الذي يتبعه سوف يكون 
ضعيفاً أيضاًء ولكن إنشاء رسم بياني للمسار يعتبر خطوة مفيدة حتى ولو 
كان الترتيب غير مؤكد. وفي العادة فإن الرسم البياني يساعد في توضيح 
الأفكار الغامضة أو شرح أفكارنا. 

المداخل التي تعتمد على نماذج المعادلة الهيكلية أصبحت تهيمن على 
العديد من مجالات مختلفة في البحوث العلمية» نماذج المعادلة الهيكلية تتعلق 
بشكل خاص بالعلوم الاجتماعية لأنها تريد سد الفراغ الموجود بين المجالات 
النظرية والبيانات. النماذج أصبحت العنوان الرئيس للكثير من الكتب التي 
تناولت قضايا مثل التقديرء ونماذج القياس» وهياكل ssl‏ والأسباب المتبادلة 
(انظر Skrondal and Rabe-Hesketh «2010 Kline‏ 2004(« مع الإأصدار 12 
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لبرنامج ستاتا قام البرنامج بإضافة pal gh‏ نماذج المعادلة الهيكلية الخاص بهء 
حيث ورد في دليل المستخدم نماذج المعادلة الهيكلية Structural Equation‏ 
Modeling Reference Manual‏ : 
نماذج المعادلة الهيكلية ليست فقط طرق تقدير لنموذج معين بنفس 
طريقة الأمر regress‏ والأمر probit‏ أو حتى بنفس طريقة الأمر stcox‏ والأمر 
xtmixed‏ ولكن نماذج المعادلة الهيكلية هي طريقة تفكير وكتابة وتقدير. 
هذا الجزء من الكتاب يشرح أمر نماذج المعادلة الهيكلية لبرنامج ستاتا 
sem‏ من خلال توسيع مبسط لانحدار متوسط العمر المتوقع. كنا قد رأينا 
سابقاً أن law sie‏ العمر المفرقع "EK MAECEN RETE‏ 
الأخرى؛ في جدول الانحدار أدناه إحصائيات + وأوزان بيتا أو مُعَاملات 
الانحدار المعيارية (العمود الموجود في الجانب الأيمن) توضح أن معدل 
وفيات الأطفال له أكبر تأثير. 
.use C:\data\Nations3.dta, clear‏ 


.regress life adfert urban loggdp  chldmort 
school regi, beta 


Source 58 af MS Number of obs = 978 
F( 6, 971) = 868.88 

Model 88961.8088 6 14826.9681 Prob > F = 0.0000 
Residual 16569.5108 971 17.0643778 R-squared = 0.8430 
لم‎ Adj R-squared = 0.8420 

Total 105531.32 977 108.01568 Root MSE = 4.1309 


س 








life coef. Std. Err. t P>|t| Beta 
adfert -.0186354 .0061076 -3.05 0.002 -.0542246 
urban .0926001 .0077519 11.95 0.000 .2355879 
loggdp .8178748 .4963185 1.65 0.100 .0425882 
chldmort -.1065984 .0063543 -16.78 0.000 -.4893582 
school -.1540576 0804122 -1.92 0.056 -.0408058 
regi -7.910748 .6323653 232.51 0.000 -.2744216 
-cons 68.87724 1.743847 39.50 0.000 


عند كتابة الأمر sem‏ يمكننا إدخال نفس النموذج وذلك LS‏ يلي: 


.Sem  (life«- adfert urban  loggdp  chldmort 
school regi), standard 
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(16 observations with missing values excluded; 
specify option 'method(mlmv)' to use all observations) 


Endogenous variables 


Observed: life 


Exogenous variables 


Observed: adfert urban loggdp chldmort school 21 


Fitting target model: 















Iteration 0: log likelihood - -18660.532 
Iteration 1: log likelihood - -18660.532 
Structural equation model Number of obs = 978 
Estimation method = ml 
Log likelihood = -18660.532 
OIM 
Standardized Coef. Std. Err. 2 P>|z| [95$ Conf. Interval] 





Structural 


life «- 
adfert -.0542246 .0176934 -3.06 0.002 -.088903 -.0195462 
urban .2355879 .0194051 12.14 0.000 -1975547 . 1 
loggdp .0425882 .0257454 1.65 0.098 -.0078719 .0930483 
chldmort -.4893582 .0283438 -17.27 0.000 -.5449109 - 5 
School -.0408058 .0212159 192 0.054 -.0823882 .0007767 
regi -.2744216 .0215576 -12.73 0.000 -.3166737 -.2321695 
—cons 6.630625 .1869022 35.48 0.000 6.264304 6.996947 










Variance 


e.life .1570104 .0070122 . 1 .1713735 


LR test of model vs. saturated: chi2(0) 0.00, Prob » chi2 - 


المُعاملات المعيارية في مخرجات الأمر sem‏ تساوي أوزان (بيتا) التي 
تم الحصو J‏ عليها باستخدام cregress yaY!‏ وبخلاف الأمر cregress‏ فإن 
الأمر sem‏ يعرض الأخطاء المعيارية للمُعاملات المعيارية» وهذا يؤدي إلى 
الحصول على إحصائيات z‏ تشبه إحصائيات ; التي أظهرها الأمر regress‏ 
ولكن مع احتما حتمالات مختلفة اختلافاً بسيطأً بسبب مقارنتها مع التوزيعات 
الطبيعية المعتدلة بدلاً من توزيعات ء» أن كتابة الأمر sem‏ بين الأقواس 
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(life<- adfert urban loggdp chldmort school reg1)‏ يحدد المسارات السببية 
للمتغير life‏ مع المتغيرأت adfert, urban‏ ... الخ. 

معدل وفيات الأطفال هو أقوى متغير تنبؤي لمتغير متوسط العمر 
المتوقع ويمكن تقديره = مثو سط العمر المتوقع - من العديد من الخصائص 
المحلية» LÍ‏ خصوبة المراهقين والتي أظهرت نتائج لم تكن GIS‏ معنوية 
إحصائية مع متوسط العمر المتوقع في نتائج regress yY)‏ أو نتائج الأمر 
sem‏ في الجدول أعلاه هي أقوى متغير تنبؤي لمعدل وفيات الأطفال. 
.regress chldmort adfert urban loggdp school‏ 


regi, beta 

Source SS df MS Number of obs - 978 
F( 5, 972) = 828.60 

Model 1801371.17 5 3602745 Prob > F = 0.0000 
Residual 422622 . 7 972  434.796983 R-squared = 0.8100 
Adj R-squared = 0.8090 

Total 2223993.84 977 9 Root MSE = 20.852 
chldmort Coef. Std. Err. t P-|t| Beta 
adfert .2318316 .0299192 7.28 0.000 .1469444 
urban -0245631 .0391215 0.63 0.530 .0136128 
loggdp -15.56996 2.455012 -6.34 0.000 -.1766092 
school -5.479663 -3658743 -14.98 0.000 -.316167 

0 





regi 57.32674 2.609213 21.97 .000 .4331934 
cons 128.5363 7.777316 16.53 0.000 . 


الشكل )13.8( يعرض زسماً بيائياً للمسار الذي يظهر به مثغير معتل 
وفيات الأطفال كمتغير دخيل تأثر بمتغير خصوبة المراهقين والخصائص 
الأخرى» وهو أيضاً متغير تنبؤي لمتوسط العمر المتوقع. ومن الناحية 
النظرية؛ فإن السبب يتجه من اليسار إلى اليمين في الشكل obi‏ والتأثيرات 
غير المباشرة يمكن أن تتبع أي مسارات تتراوح من المتغيرات التي dia‏ 
الخصائص المحلية للمجتمع إلى متغير معدل الوفيات chldmort‏ ومن متغير 
1 إلى متغير Giles pall life‏ الظاهرة في الرسم أدناه تمثل متغيرات 
منظورة في النموذج» سوف يتم التطرق إلى موضوع المتغيرات غير 
المنظورة أو المخفية في الفصل (12). 
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الشكل )13.8( 


الشكل )13.8( أعلاه تم إنشاؤه باستخدام واجهة المستخدم البيانية 
(GUDgraphical user interface‏ والتي تسمى «SEM Builder‏ ويمكن الحصول 
على مربع حوار واجهة المستخدم البيانية من خلال طباعة الأمر: 
.Sembuilder‏ 
أو بواسطة استخدام قائمة ستاتا: 
Statistics » SEM (structural equation modeling)‏ 
Model building and estimation‏ < 
للحصول على معلومات عن كيفية البدء في استخدام واجهة المستخدم 
البيانية قم بطباعة الأمر help  sembuilder‏ العناصر الرئيسة في الشكل 
)13.8( هي المتغيرات المنظورة؛ أول شيء لإنشاء الرسم البياني تتم 
بإضافة مربعات خالية باستخدام أداة إضافة متغير ملحوظ Add Observed‏ 
Variable‏ من القائمة الموجودة في يسار الشاشةء ثم بعد ذلك تتم إضافة 
أسماء المتغيرات عن طريق اختيار كل مربع باستخدام أداة «Select‏ وإضافة 
الأسماء من خلال القائمة المنسدلة Variable‏ أداة إضافة المسار Add Path‏ 
يمكنها ربط المتغيرات» وما عليك إلا النقر على المتغير الخارجي أو المسبب 
ثم سحبه إلى السهم ليربط المتغير الداخلي أو المتأثر. 
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من قائمة شريط الأدوات الموجودة في أعلى الإطار قم باختيار 
Estimation > Estimate‏ للحصول على المُعاملات والإحصائيات الأخرى 
للنموذج. الشكل )14.8( يعرض النتائج الافتراضية لتقدير الشكل )14.8( 
وكل مسار متعلق مع مسار معياري أو معامل انحدار مثل معامل انحدار 
adfert‏ على chidmort‏ 0.23 (قارن مع جدول الانحدار أعلاه). 





الشكل (14.8) 


في كل مربع لكل متغير خارجي في الشكل (14.8) لدينا متوسط وتباين 
للمتغير. التحليل الموجود لدينا يحتوي على 178 دولةء متوسط المتغير 
1 يساوي 32 da ul‏ والتباين يساوي 9.14+02-910: مربعات المتغيرات 
الخارجية تحتوي على قيم تقاطعها مع المحور العمودي 1.3e+02=130 She y‏ 
للمتغير chldmort‏ مرة أخرى قم بالمقارنة مع نتائج الانحدار السابق» وأخيراً 
الشكل )14.8( يعطي تباين البواقي المتعلقة بالخطأ العشوائي el(chidmort)‏ 
و -€2(life)‏ 

وهناك إصدار أكثر بساطة للشكل أعلاه يحتوي على مُعَاملات المسار 
المعياري» وتباين البواقي المعيارية في الشكل (15.8)» هذا التبسيط يمكن 
القيام به عن طريق قائمة الاختيارات الموجودة في أعلى إطار SEM Builder‏ 
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Settings > Variables > All .. > Results > 
Exogenous variables > None > OK 

Settings > Variables > All .. > Results > 
Endogenous variables > None > OK 

Settings > Variables > Error .. > Results > 
Error std. variance > OK 

Settings > Connections > Paths > Results > Std. 
parameter > OK 

Settings > Connections > All > Results > Result 
1 > Format %3.2£ > OK > OK 

Settings > Connections > All > Results > Result 
2>None > OK 

Estimation > Estimate > OK 





الشكل )15.8( 


الشكل )15.8( يتعلق بالأمر olif sem‏ والذي له مجموعة من الأسئلة 
المنفصلة للمتغير life‏ والمتغير chldmort‏ 


¿sem  (life«- adfert urban  loggdp chidmort 
school regi) 

(chldmort«- adfert urban loggdp school regi), 
standardized 
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(16 observations with missing values excluded; 
specify option 'method(mimv)' to use all observations) 


Endogenous variables 
Observed: life chldmort 
Exogenous variables 

Observed: adfert urban loggdp school regl 


Fitting target model: 


log likelihood = -18660.532 
log likelihood = -18660.532 


Iteration 0: 
Iteration 1: 


Number of obs = 978 


Structural equation model 
Estimation method 
Log likelihood 


mi 
-18660.532 


" 









[95$ Conf. Interval] 













Standardized Coef. Std. Err. z P»|z| 


Structural 


life <- 

chldmort -.4893582 .0285822 -17.12 0.000 -.5453783 -.4333381 
adfert -.0542246 .0176966 -3.06 0.002 -.0889092 -.01954 
urban .2355879 .0194596 12.11 0.000 .1974478 9 
loggdp .0425882 .0257468 1.65 0.098 -.0078746 .0930509 
school -.0408058 .0212174 21:92 0.054 -.0823912 .0007796 

regi -.2744216 .0216242 -12.69 0.000 -.3168041 -.232039 

—cons 6.630625 .1913384 34.65 0.000 6.255609 7.005642 


chldmort «- 
ad*ert .1469444 .0187839 7.82 0.000 .1101287 . 161 
urban .0136128 .0216136 0.63 0.529 -.028749 .0559746 
loggdp -.1766092 .0276417 -6.39 0.000 -.2307861 -.1224324 
school -.316167 .0205339 -15.40 0.000 -.3564127 -.2759212 
regl .4331934 .0186128 23.27 0.000 .396713 .4696738 
_cons 2.695432 .1604064 16.80 0.000 2.381041 3.009822 
















Variance 





e.life .1570104 .0072756 .1433788 .1719379 
e.chldmort .1900287 .0084368 .1741919 .2073053 
LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = 


التأثير غير المباشر والكلي يمكن حسابه بسهولة يدوياًء فالتأثير غير 
المباشر يساوي المُعاملات المتحصل عليها مع أي سلسلة للمسارات المببية 
التي تربط pace‏ بآخر. التأثير الكلي يساوي مجموع كل التأثيرات المباشرة 
وغير المباشرة التي تربط متغيرين اثنين. عند قراءة المُعاملات المعيارية من 
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uar‏ الان وي ا PER‏ مي 
الشكل )15.8( فإنه يمكن القول بأن خصوية المراهقين تؤثر على متوسط 
العمر المتوقع» وهذه التأثيرات كما يلي: 
مباشر 0.05- 
غير مباشر 0.07- = 0.15x(-0.49)‏ 
كلي 0.12-=0.05-0.07- 
أو بعبارة أخرىء هذا النموذج يتوقع أنه في حالة OLS‏ العوامل الأخرى» 
فإن زيادة الانحراف المعياري لمتغير خصوبة المراهقين بمقدار نقطة واحدة 
alld,‏ من خلال التأثيرات المباشرة وغير المباشرة. التأثير المباشر لمتغير 
adfert‏ أقرب للصفرء ولكنه سببي مهم بسبب التأثير غير المباشر لمعدل 
وفيات الأطفال. 
وبحسابات مشابهة لما قمنا به من idi‏ فإن تأثير موقع أفريقيا 
(المشاكل الموجودة في أفريقيا لم يتم قياسها بأي متغير في النموذج) له تأثير 
أكثر من ضعف تأثير المتغير weg]‏ 
مباشر 0.27- 
غير مباشر 0.21- = 0.43x(-0.49)‏ 
كلي 0.48-=0.27-0.21- 
سوف نعود مرة أخرى لنماذج المعادلة الهيكلية في Glow‏ التحليل العاملي 
factor analysis‏ بالفصل (12). 


Ug 


الانحدار اللوغاريتمي 
Logistic Regression‏ 





Saison‏ ف 


طرق الانحدار التي سبق تناولها في الفصلين )7 و8) تتطلب - بشكل 
عام - متغيرات تابعة قابلة للقياس. ولكن برنامج ستاتا يوفر عددًا كبيرًا من 
التقنيات لصياغة النماذج التصنيفية» والترتيبيةء والمتغيرات التابعة المقاربة. 
القائمة أدناه تعرض بعض الأفكار لعدة طرق متوافرة. وللحصول على 
تفاصيل حول أوامر Aima‏ قم بطباعة الأمر chelp command‏ وتعتبر دراسة 
Long and Freese‏ )2006( من أفضل المصادر التي تشرح الطرق الرئيسة 
لبرنامج ستاتا للمتغيرات التابعة المحدودة» كما يمكنك الاطلاع على دراسة 
Hosmer and Lemeshow‏ (2000). 


asclogit 
asmprobit 
asroprobit 
biprobit 
binreg 
blogit 
bprobit 
clogit 
cloglog 


constraint 


بديل محدد بلوغاريتم مشروط (خيار ماك فادن “(McFadden‏ 
بديل محدد بانحدار الاحتمال المتعدد. 

بديل محدد بانحدار الاحتمال متعدد الرتب. 

انحدار الاحتمال الثنائي. 

الانحدار الثنائي (نماذج خطية عامة). 

التقدير اللوغاريتمي مع بيانات مجمّعة (مقفلة). 

تقدير احتمالي مع بيانات مجمّعة (مقفلة). 

الانحدار اللوغاريتمي للتأثيرات الثابتة المشروطة. 

تقدير لوغاريتمي- لوغاريتمي مكمل. 

تعريف وتحديد واستبعاد القيود الخطية. 
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exlogistic 


gim 


glogit 
gprobit 
heckprob 
hetprob 


intreg 


ivprobit 
logistic 


logit 


mlogit 
nologit 
ologit 
oprobit 
probit 


rologit 


scobit 


slogit 
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الانحدار اللوغاريتمي الدقيق 
نماذج خطية Aa‏ تتضمن HLS‏ لإنشاء نموذج لوغاريتمي أو 


ELE a احتمالي اللي‎ 


p pre ree‏ مجمعة. 

الانحدار الاحتمالي لبيانات مجمعة. 

التقدير الاحتمالي مع الاختيار. 

التقدير الاحتمالي لاختلاف التباين. 

انحدار الفتر ةه حيث إن y‏ نقطة بيانات أوبيانات الفترة أو 
بيانات تم فحصها مسبقا. 

الاحتمال مع متغيرات الانحدار الخارجية المستمرة. 

الانحدار اللوغاريتمي مع دسب الاحتمال. 

الانحدار اللوغاريتمي وهو مشابه للأمر dogistic‏ ولكن يعطي 
مُعاملات بدلا من نسب احتمال. 

الانحدار اللوغاريتمي المتعدد للمتغيرات y‏ متعددة التدريج. 
تقدير لوغاريتمي متداخل. 

الانحدار اللوغاريتمي لمتغيرات ر الترتيبية. 

الانحدار الاحتمالي لمتغيرات بر الترتيبية. 

الانحدار الاحتمالي لمتغير بر الثنائية. 

النموذج اللوغاريتمي لتنظيم الرتب LS)‏ يُعرف Laf‏ بنموذج 
Plackett-Luce‏ 3 النموذج اللوغاريتمي الموسع 3 تحليل 
المشترك الاختياري). 

التقدير الاحتمالي الملتوي. 

الانحدار اللوغاريتمي النمطي. 
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US الانحدار اللوغاريتمي مع بيانات دراسة استقصائية معقدة»‎ svyslogit 
(svy) يوجد كذلك العديد من أوامر الدراسات الاستقصائية‎ 
الخاصة بنماذج المتغيرات التصنيفية. (لمزيد من التفاصيل قم‎ 
. (help svy estimation بطباعة‎ 

+6 انحدار توبت Tobit‏ الذي يفترض أن ريتبع توزيع جاوس» 
ولكن يتم فحصه مسبقاً عند نقطة ثابتة معروفة. (للحصول 

على معلومات أكثر قم بطباعة الأمر (help enreg‏ . 
xtmelogit‏ نماذج متعددة المستويات أو نماذج مختلطة لوغاريتمية ثنائية 
مع التأثيرات العشوائية أو الثابتة. للحصول على معلومات 
أكثر عن هذا الأمر» قم بطباعة help xtmelogit‏ وسوف يتم 
شرح هذا الأمر لاحقاً في الفصل (13). وهناك العديد من 
الأوامر الخاصة بالبيانات الطولية (Panel Data)‏ وللمصول 

على قائمة بهذه الأوامر قم بطباعة الأمر -help xt‏ 
بعد الاطلاع على أغلب أوامر النماذج» يمكن predict yU‏ حساب القيم 
المتوقعة أو الاحتمالات. كما يمكن للأمر predict‏ عرض الإحصائيات 
التشخيصية مثل تلك التي سبق شرحها للانحدار اللوغاريتمي في دراسة 
Hosmer and Lemeshow‏ )2000( استخدام خيار معين مع الأمر predict‏ يعتمد 
على نوع النموذج المستخدم. هناك أمر يُستخدم بعد صياغة النموذج.وهو 
الأمر predictnl‏ يقوم بحساب التوقعات غير الخطية وفترات ثقتها. (لمزيد 
من المعلومات قم بطباعة الأمر «(help predictni‏ كما أن الأمر margins‏ 

والأمر marginsplot‏ مزع الأو اضر المفيدة في هذا الصدد. 

هناك العديد من ABI‏ عن هذه الأوامر سوف يتم تتاولها لاحقاً في هذا 
الجزء. وعموماً فإن الطرق المتعددة للنماذج النوعية أو المتغيرات التابعة 
المحدودة» يمكن الوصول إليها عن طريق استخدام عدد من قوائم ستاتا. وهذه 

القوائم تتضمن: 

Statistics < Binary outcomes 
Statistics < Ordinal outcomes 
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Statistics » Categorical outcomes 

Statistics » Generalized linear models 

Statistics » Longitudinal/panel data 

Statistics » Linear models and related 

Statistics » Multilevel mixed-effects models 

بعد rp m sjal‏ ين الفصل على مجموعة 

مهمة من الطرق تسمى الانحدار اللوغاريتمي أو اللوجيستي. سوف نقوم 

بإلقاء نظرة سريعة على الطرق اللوغاريتمية الأساسية للمتغيرات التابعة ذات 

التصنيفات المتعددة والترتيبية والثنائية. الفصل (13) يقوم بشرح الشكل 
اللوغاريتمي لنماذج التأثيرات الثابتة. 


Example Commands : عن الاوامر‎ alni 





.logistic y x1 x2 x3 
على‎ y(0,1) يقوم بحساب الانحدار اللوغاريتمي للمتغير الثنائي‎ 
وتأثيرات المتغير التنبؤي يتم عرضها كنسب‎ ×3, x2, x] المتغيرات التنبؤية‎ 
الذي يقوم بحساب نفس‎ logit احتمالية؛ والأمر الأقرب للأمر أعلاه هؤ‎ 
الانحدار تقريباًء ولكن يعرض التأثيرات كمُعاملات انحدار محتملة مسجلة.‎ 
هي نفسهاء ولذلك فإن‎ logit والأمر‎ logistic والنماذج المحددة بالأمر‎ 
التوقعات والاختبارات التشخيصية سوف تكون متطابقة.‎ 
.estat gof 
المطابقة‎ Cue Al يقوم هذا الأمر بحساب اختبار مربع كاي لبيرسون‎ 
للنموذج اللوغاريتمي وهو عبارة عن: مقارنة التكرارات المتوقعة مع‎ 
باستخدام خلايا تم تعريفها بواسطة نمط المتغيرات‎ y = 1 المحسوبة المتغير‎ 
فيمكنناً وضع‎ x المتغير‎ Lud عند وجود عدد كبير من‎ «(x المستقلة (المتغير‎ 
estat ui ja هذه الأنماط في مجموعات حسب الاحتمالات المقذرة‎ 
يقوم بحساب الاختبار مع 10 مجموعات متساوية تقر‎ group(10) 


.estat ibd tient 
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يقوم بعرض الإحصائيات المصنفة وجدول التصنيفات» الأمر 
estat classification‏ والأمر Iroc‏ والأمر Isens‏ (المعروضة أدناه) n‏ مفيدة 
عندما يكون هدف التحليل هو التصنيف. هذه الأوامر جميعها تشير إلى 
النموذج اللوغاريتمي السابق. 
.lroc‏ 
يقوم بإنشاء رسم بياني يوضح منحنى خاصية عمل المتلقي (ROC)‏ ويقوم 
بحساب المنطقة التي eS‏ تحت المنحنى. 
-lsens‏ 
يقوم بإنشاء رسم بياني للحساسية والخصوصية مقابل نقطة القطع 
الاحتمالي. 
.predict phat‏ 
يقوم بإنشاء متغير جديد (تم تسميته عشوائياً باسم (phat‏ يساوي 
الاحتمالات المتوقعة التي فيها المتغير 1 = ely dll, y‏ على آخر نموذج 
لوغاريتمي. 
predict dX2, 2‏ 
يقوم بإنشاء متغير جديد (تم تسميته عشوائياً باسم (dx2‏ الإحصائية 
التشخيصية تقوم بقياس التغير في اختبار مربع كاي لبيرسون من آخر تحليل 
لوغاريتمي. 
emlogit y x1 x2 x3, base(3) rrr nolog‏ 
يقوم بحساب الانحدار اللوغاريتمي المتعدد لمخرجات متعددة للمتغير y‏ 
على ثلاثة متغيرات ac‏ الخيار base(3)‏ يقوم بتحديد أن 3 = Cae Sy‏ 
أساسي للمقارنة؛ والخيار rrr‏ يقوم بعرض نسب الخطر المتعلقة CDL ay‏ 
الانحدارء والخيار aie nolog‏ عرض سجل الاحتمال لكل تكرار. 
.Svy:mlogit y x1 x2 x3, base(3) rrr nolog‏ 
يقوم بحساب الانحدار اللوغاريتمي المتعدد الموزونٍ للدراسات 
الاستقصائية» Ha y‏ يتطلب: أن تكون البياناث قد تم تعريفها مسبقاً على أنها 
بيانات دراسة استقصائية باستخدام الأمر svyset‏ (انظر الفصل 4(« الأشكال 
المختلفة لأوامر الدراسات الاستقصائيةء وأوامر الانحدار اللوغاريتمي 
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logit, ologit‏ وأو امر صياغة النماذج الأخرى لها نفس التركيبة تقريباً وتشبه 
نظيراتها الأخرى. 
.predict P2, outcome(2)‏ 
يقوم بإنشاء متغير جديد (تم تسميته عشوائياً باسم (P2‏ يمثل الاحتمال 
المتوقع عندما 2 7 sly y‏ على آخر تحليل تم إجراؤه بالأمر .mlogit‏ 
.gim successx1 x2 x3, family(binomial trials)‏ 
eform‏ 


يقوم هذا الأمر بحساب الانحدار اللوغاريتمي من خلال إنشاء نموذج 
خطي ale‏ باستخدام جداول Yas‏ من المشاهدات الموجودة بالبيانات. المتغير 
success‏ يعطي عدد المرات التي ظهرت فيها المخرجات ذات العلاقة. أما 
المتغير trials‏ فيعطي عدد المرات التي كان يمكن أن تحدث لكل Á c gaza‏ 
من المتغيرات التنبؤية x3, x2, x1‏ ولذا فإن المتغيرين success/trials‏ سوف 
يساويان عدد المرات التي حدثت فيها المخرجات مشل احتمال تعافي 
المريض» الخيار eform‏ يعرض النتائج في شكل نسب مرجحة (شكل (und‏ 
بدلا من Dukes‏ لوغاريتمية 
obly‏ مكوك الفضاء : Space Shuttle Data‏ 


المثال الأول في هذا الفصل» يتضمن بيانات موجودة بالملف cshuttle.dta‏ 
وهو يحتوي على بيانات تاريخية تغطي أول 25 رحلة لمكوك الفضاء 
الأمريكي. هذه البيانات تتضمنٍ دليل أنه إذا تم تحليل البيانات بطريقة 
صحيحة؛ فإن النتائج يجب PECES‏ أنهم لم 
يُطلقوا مكوك الفضاء تشالنجر في رحلته المميتة في سنة 1985 (الرحلة 25 
لمكواك الفضاء والتي كانت تحمل رقم 51-1 (STS‏ البيانات تم الحصول 
عليها من تقرير رئيس لجنة التحقيق في حادثة مكوك الفضاء تشالنجر في 
سنة 1986 ومن كتاب Tufte‏ (1997)» هذا الكتاب يتضمن نقاشاً رائعاً حول 
البيانات وقضايا التحليل. تعليقات Tufte‏ بشأن رحلات فضائية محددة نتضمن 
متغيرا نصّياً في هذه البيانات. 
.use C:\data\shuttle.dta, clear‏ 
.describe‏ 
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ال الا 


Contains data from C:\data\shuttle.dta 





obs: 25 First 25 space shuttle flights 
vars: 8 2 Jul 2012 06:11 

size: 1,575 

storage display value 

variable name type format label variable label 
ee 
flight byte %8.0g flbl Flight 
month byte $8.0g Month of launch 
day byte $8.0g Day of launch 
year int $8.0g Year of launch 
distress byte $8.0g dlbl Thermal distress incidents 
temp byte $8.0g Joint temperature, degrees F 
damage byte %9.0g Damage severity index, Tufte 1997 
comments str55 %55s Comments, Tufte 1997 


ee 
Sorted by: flight 


.list flight-temp, sepby(year) 


flight month day year distress temp 


10. STS_41-B 
It, STS 41-C 
12. STS 41-D 
Tsz STS_41-G 
14. STS 51-A 


15. STS| 51-C 
16. STS_51-D 
17. STS 51-B 
18. STS 51-G 
49. STS.51-F 
20. STS 51-I 
21. STS 51-J 
22. STS 61-A 
23. STS_61-B 


24. STS 61-C 
25. STS 51-L 
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هذا «hail‏ يقوم باختبار ثلاثة متغيرات بملف البيانات shuttle.dta‏ هي: 


distress‏ يمثل عدد "حوادث التلف الحراري" التي انفجر فيها الغاز 
الساخن أو تلف حراري في أغلفة الوصلات لصواريخ الدفعء 
هذا التلف في أغلفة الوصلات في صواريخ الدفع ساهمت 
بدرجة كبيرة بحادثة تشالنجرء وقد عانت العديد من الرحلات 
الفضائية السابقة من تلف أقل خطورةء لذلك كان من المعروف 
أن أغلفة الوصلات هي مصدر خطر محتمل. 


åa ja temp‏ حرارة الوصلات المحسوبة عند الإطلاق مقاسة 
بالفهرنهايت. درجة الحرارة تعتمد بشكل كبير على درجة 
حرارة «sal!‏ حيث إن وصلات صواريخ الإطلاق المطاطية 
الدائرية تصبح أقل مرونة في البرودة. 
date‏ متغير التاريخ وهي مقاسة بالأيام التي انقضت بعد 1 يناير 
date yia «1960‏ عبارة عن شهر ويوم وسنة الإطلاق 
باستخدام الدالة mdy‏ (شهر - يوم - سنة للزمن المنقضي؛ 
لمزيد من التفاصيل قم بطباعة .(help dates‏ 
.generate date = mdy(month, day, year)‏ 


.format %td date 
.label variable date "Date (days since 1/1/60)' 


التواريخ المنقضية Ange‏ لأن العديد من التغيرات خلال فترة برنامج 
الرحلات الفضائية ربما أصبحت أكثر خطورة بمضي الزمن. حيث إن 
حوائط صاروخ الإطلاق أصبحت أقل Sede‏ لتوفير مساحة وزيادة الحمولة. 
وإغلفة الوصلات تم اختبارها تحت ضغط أعلى. بالإضافة إلى ذلكء فإن 
أجهزة المكوك الفضائي القابلة لإعادة الاستخدام تم صيانتهاء لذلك فإننا قد 
نتساءل: هل احتمال أن التلف المصاحب لصواريخ الدفع (واحد أو أكثر 
حادثة تلف حراري) زادت مع تواريخ الإطلاق؟ i‏ 
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ee‏ 

distress xal‏ تم توصيفه كمتغير رقمي. 
.tabulate distress‏ 


Thermal 
distress 


incidents Freq. Percent Cum. 





في bala‏ فإن الأمر tabulate‏ يقوم بعرض توصيف القيمء والخيار 
nolabel‏ يوضح أن الرموز الرقمية التي تصف القيم هي "none"‏ = 0« 1“ = ] 
plus” « or2"‏ 2-3 


.tabulate distress, nolabel 


Thermal 
distress 


incidents Freq. Percent Cum. 





يمكننا استخدام هذه الرموز لإنشاء متغير وهمي cany awl‏ هذا المتغير 
الذي يساوي cO‏ يمثل عدم حدوث أي مشاكل حراريةء و1 عند حدوث مشكلة 
حرارية واحدة أو أكثر كما يلي: 


generate any = distress 
replace any = 1 if distress == 
-label variable any "Any thermal distress' 


لفحص ما إذا كان الأمر generate‏ والأمر replace‏ كم إنجازهما كما 
يجب» والتأكد بأن القيم المفقودة تم التعامل معها بشكل صحيح؛ قم بطباعة 
الأمر: 
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سس س7 7 777370777777 کا کک کے 


.tabulate distress any, miss 


Thermal 
distress Any thermal distress 
incidents 0 1 š Total 





نماذج الانحدار اللوغاريتمي تحدد كيف أن متغيرا ثنائياً }0,1{ مشل 
متغير any‏ يعتمد على واحد أو أكثر من متغيرات x‏ تركيبة الأمر logit‏ تشبه 
تركيبة الأمر cregress‏ وأغلب أوامر النماذج الأخرى مع متغير تابع يكون 
في الأول. 


.logit any date 


Iteration 0: log likelihqod = -15.394543 
Iteration 1: log likelihood = -12.997472 
Iteration 2: log likelihood - -12.991097 


Iteration 3: log likelihood - -12.991096 


Logistic regression Number of obs = 23 
LR chi2(3! = 4.81 
Prob > chi2 = 0.0283 
Log likelihood = -12.991096 Pseudo R2 = 0.1561 









Coef. Std. Err. z P»|z| [95$ Conf. Interval] 








date .0020907 .0010703 1.95 0.051 -6.94e-06 .0041884 


-18.13116 9.517253 21.91 0.057 -36.78463 .5223142 





الأمر logit‏ يكرر طريقة التقدير للوصول إلى الحد الأعلى من سجل دالة 
الاحتمال المعروضة في الجدول اللوغاريتمي Í‏ علاه. عند التكرار 0« فإن 
سجل الاحتمال يشرح تناسب النموذج متضمناً ثابتاً فقط. آخر سجل للاحتمال 
يشر ح تناسب النموذج النهائي. 
L=-18.13116 + 0.0020907date [9.1]‏ 
حيث إن 1 يمثل اللوغاريتم المتوقع أو سجل الترجيح GY‏ حادث تلشف 
حراري: 
In[P(any = 1) / P(any = 0)] [9.2]‏ = 
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ioc ARCU EN SOA pel] vial القن‎ 


واختبار y!‏ عموماً في الجانب الأيمن العلوي يقوم بتقييم فرضية العدم 
التي تفترض أن كل المُعَاملات في النموذج تساوي ia‏ باستثناء الثابت. 
In.29 [9.3]‏ - #كم)2- C=‏ 
حيث إن ”> تمثل الاحتمال المسجل الأولى أو التكراري 0 (نموذج مع 
ثابت فقط) Ingy‏ تمثل الاحتمال المسجل للتكرار النهائي» حيث يمكن كتابة 
المعادلة كما يلي: 
xi = -2[-15.394543-(-12.991096)]‏ 
1 4- 
احتمال الحصول على قيمة أكبر ل aa?‏ درجة حرية تساوي 1 (الفرق 
في التعقيد بين النماذج الأولية والنهائية) احتمال منخفض بما فيه الكفاية 
)0.0283( لرفض فرضية العدم في هذا المثال. وبالتالي» فإن المتغير data‏ 
ليس له تأثير ذو معنوية إحصائية. 
بالرغم من انخفاض دقتها وسهولتهاء فإن الاختبارات التي يوفرها z‏ 
inde:‏ المعياري) إحصائيات تم عرضها مع نتائج cogit‏ مع وجود متغير 
تنبؤي واحد وهو إحصائية z‏ للمتغير التنبؤي واحصائية X‏ تختبر الفرضيات 
المكافئةء فإن هذا الوضع يشبه تماما إحصائيات eee‏ كوم cd‏ انحدار 
OLS‏ البسيطء PEDES qais‏ 5 فإن تقريب z‏ اللوغاريتمي» واختبارات 
2 أحياناً لا تتفق (وكذلك نحن)» اختبار 7 يكون صالحا بشكل عام. 
مشابهاً لبعض طرق الاحتمال ببرنامج ستاتاء فإن الأمر logit‏ يتعرض 
محدد ۸7 وهمي كما يلي: 
In ¢ [9.4]‏ /#كها - 1 = ۸ الوهمي 
وفي هذا المثال» فإن المعادلة أعلاه ستكون: 
cs sll R? = 1 - (-12.991096) / (-15.394543)‏ 
0.1561 = 
بالرغم من أن إحصائيات R‏ الوهمية تعتبر طريقة سريعة لوصف 
ومقارنة مدى تناسب النماذج المختلفة لنفس المتغير التابع» إلا أنها تفتقر إلى 
التفسير الواضح للتباين بالنسبة R‏ الحقيقية في تحليل انحدار 01.5. 
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بعد التحليل باستخدام الأمر dogit‏ فإن استخدام الأمر predict‏ (بدون 
إضافة أي خيارات) يُمكننا من الحصول على الاحتمالات المتوقعة. 
Phat - 1/)1+ e^) [9.5]‏ 
عند إنشاء رسم بياني للاحتمالات المتوقعة مع المتغير edate‏ فإن 
المنحنى اللوغاريتمي سوف يكون على USA‏ حرف Lad WY «S‏ بتحديد 
الخيارات ila format %td date‏ بعد أن قمنا بتعريف المتغير «date‏ القيم تم 
توصيفها بشكل مناسب في المحور الأفقي أو محور الزمن في الشكل )1.9( 
.predict Phat‏ 
.label variable Phat "Predicted P(distress »- 1)'‏ 


.graph twoway connect Phat date, xtitle("Launch 
date") sort 


1 
LL ecd. 


8 


Predicted P(distress >= 1) 


4 6 
PM "s 


2 
— 





$y IE a ee a I ES E 
01jan1981 01jan1982 01jan1983 01jan1984 O1jani985 01jan1986 
Launch date 

الشكل )1.9( 


مُعَامل الأمر logit‏ في هذا المثال )00020907( يصف تأثير المتغير 
date‏ على الاحتمالات اللوغاريتمية لوقوع حوادث التلف الحراريء؛ كل يوم 
إضافي يزيد من الاحتمالات اللوغاريتمية ية المتوقعة للتلف الحراري بقيمة 
7 وبعبارة أخرى يمكننا القول إن كل يوم إضافي يضاعف 
الاحتمالات اللوغاريتمية المتوقعة للتلف الحراري بقيمة 0002001(12-1.23ي), 
em 2.71828)‏ الرقم الأساسي للوغاريتم الطبيعي)ء ويمكن لبرنامج ستاتا حفظ 
co‏ بعد كل عملية تحليل» وذلك بإضافة b[varname]‏ كما يلي: 
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ست ع ا ا PEE POTENS.‏ 


.display exp( b[datel) 
1.0020929 

¿display exp( b[date])^100 
12325358 


يمكننا ببساطة إضافة الخيار or‏ (النسبة pd‏ مع سطر الأمر 
cogit‏ الطريقة الثالثة للحصول على النسب الاحتمالية تتم عن طريق الأمر 
clogistic‏ وسيتم شرحها في الجزء التالي. الأمر logistic‏ يتناسب بالضبط مع 
نفس النماذج التي يتناسب معها الأمر cogit‏ ولكن الوضع الافتراضي لجدول 
مخرجاته يعرض النسب الاحتمالية بدلا من عرض المُعاملات. 
استخدام الاخدار اللوغاريتهي : Using Logistic Regression‏ 
a PRA GR. "GE QUNM LN, cub, Diei‏ 


الأمر أدناه هو نفس تحليل الانحدار الذي قمنا به سابقاًء ولكن باستخدام 
الأمر logistic‏ بدلا من الأمر logit‏ 
¿logistic any date‏ 


Logistic regression Number of obs = 23 
LR chi2(1) = 4.81 
Prob > chi2 = 0.0283 
Log likelihood = -12.991096 Pseudo R2 = 0.1561 











Odds Ratio Std. Err. P»|z| [95% Conf. Interval] 









1.002093 -0010725 1.95 0.051 -9999931 1.004197 
1.34e-08 1.27e-07 -1.91 0.057 1.06e-16 1.685925 


يجب ملاحظة تشابه الاحتمالاث اللوغاريتمية وإحصائيات of‏ وبدلاً من 
عرض المُعَاملات فإن الأمر logistic‏ يعرض النسب الاحتمالية ©): القيم 
المعروضة تالو Odds Ratio‏ لجدول مخرجات الأمر logistic‏ أعلاه هي 
عبارة عن أرقام» وهذه الأرقام هي احتمالات US y‏ زيادة في الاحتمال بمقدار 
وحدة واحدة يؤدي إلى زيادة في المتغير × IY)‏ كانت قيم متغيرات × الأخرى 
ثابتة). 

بعد تحديد النموذج المناسب يمكننا الحصول على جدول تصنيفي 
والإحصائيات ذات العلاقة بطباعة الأمر التالي: 


.estat class 
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Logistic model for any 


Classified 





Classified + if predicted Pr(D) >= .5 





True D defined as any !- 0 

 BoMRÁm:‏ ا ینت 
Sensitivity Pr( «| D) 85.71%‏ 
-|-D) 55.56%‏ )عم Specificity‏ 
Positive predictive value Pr( D| +) 75.00%‏ 
Negative predictive value Pr(~D| -) 71.43%‏ 
ee‏ ی ےک 
False + rate for true ~D Pr( +|~D) 44.44%‏ 
False - rate for true D Pr( -| D) 14.29%‏ 
False + rate for classified + Pr(~D| +) 25.00%‏ 
D| -) 28.57%‏ )عم - False - rate for classified‏ 
Correctly classified 73.91%‏ 





الوضع الافتراضي estat class OU‏ أن يقوم باس تخدام احتمال 0.5 
كنقطة قطع (ويمكننا تغييره بإضافة الخيار «(cutoff‏ الرموز التي تظهر في 
جدول التصنيف أعلاه لها المعاني التالية: 

D‏ وقوع الحدث موضع الدراسة (وهذا يعني 1 ر لتلك المشاهدة وفي هذا 
ox D Qua‏ إلى وقوع تلف حراري. 

^D‏ عدم وقوع الحدث موضع الدراسة (وهذا يعني 0 = (y‏ لتلك المشاهدة» وفي 
هذا المثال D‏ ~ ترتبط بالرحلات التي لم يحدث فيها تلف حراري. 

4 الاحتمال المتوقع للنموذج أكبر من أو يساوي نقطة (geil‏ وحيث إننا 
استخدمنا نقطة القطع الافتراضية؛ فإن علامة + هنا تشير إلى أن النموذج 
يتوقع 0.5 أو أكبر لاحتمال التلف الحراري. 

- الاحتمال المتوقع أقل من نقطة القطع؛ وهنا علامة - تعني أن الاحتمال 
المتوقع للتلف الحراري أقل من 0.5. 
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5 ولذلك فإن 12 رحلة وتصنيفاتها كانت دقيقة في سياق أن النموذج قام 
بتوقع 0.5 من احتمال التلف الحراري وهذا وقع بالفعل. وبالنسبة لبقية 5 
رحلات» فإن النموذج يتوقع JÉ‏ من 0.5 من احتمال التلف الحراري وهذا لم 
يحدث فعلا. وبصفة عامة» فإن معدل التصنيف الصحيح يكون 5+12 = 17 
رحلة من chal‏ 23 رحلة أو .9673.91( كما أن الجدول يعرض الاحتمالات 
المشروطة مثل الحساسية أو نسبة المشاهدات التي تكون فيها 0.5 < P‏ مع 
hadh‏ حدوث التلف الحراري (12 من أصل 14 أو 9685.71( 
بعد استخدام الأمر logistic‏ أو الأمر logit‏ یمکننا استخدام الأمر predict‏ 
لحساب توقعات متعددة وإحصائيات تشخيصية أخرىء يمكن الحصول على 
Hosmer and Lemeshow‏ )2000(- 
predict newvar‏ الاحتمال المتوقع الذي يكون فيه y71‏ 
predict newvar, xb‏ الاحتمال الخطي (احتمالات لوغاريتمية متوقعة 
يكون فيها 1 -بر) 
predict newvar, stdp‏ الخطأ المعياري للتنبؤ الخطي. 
AB predict newvar, dbeta‏ تأثير الإحصائيات وهو يماثل مسافة كوك 
Coo'sD `‏ 


x لنمط المتغير‎ jth الانحراف المتبقي للمشاهدة‎ predict newvar, 
ü deviance 
lj وهو‎ 


A x) التغير في 7 لبيرسون والذي يمكن كتابته‎ predict newvar, dx2 


A a 3 
A أو‎ AD ويمكن كتابته‎ yd التغير في انحراف‎ predit newvar, 
ES eviance 


predict newvar, hat‏ تأثير المشاهدة jth‏ على نمط المتغير x‏ ويكون 
هو hj‏ 


predict newvar,‏ تخصيص أرقام لأنماط المتغير x‏ حيث تكون 
J7 15253. number‏ 
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x لنمط المتغير‎ jth باقي بيرسون للمشاهدة‎ predict newvar, resid 
ry وهذا الباقي هو‎ 


aL predict newvar,‏ © المعناء 
qam Bra ond rstandard f‏ 


d predict newvar, score‏ مشتقة من Quas YI‏ اللو غاريتمي مع الأخذ 
بالاعتبار Xb‏ 
الإحصائيات التي يتم الحصول عليها عن طريق استخدام 
dbeta, dx2, ddeviance, ható Ls)‏ لا تقوم بقياس تأثير كل مشاهدة على 
حدة كما تفعل نظائرها في تحليل الانحدار العادي» وإنما تقوم بقياس تأثير 
أنماط المتغيرات المستقلة» وبالتالي فهي تستبعد المشاهدات التي تحتوي على 
مجموعة خاصة من قيم ×. لمزيد من المعلومات انظر دراسة Hosmer and‏ 
Lemeshow‏ )2000(- 
هل صواريخ الدفع مع درجة الحرارة lee‏ يؤثران على احتمال حدوث 
التلف الحراري؟ يمكننا التحقق من ذلك عن طريق تضمين متغير درجة 
الحرارة temp‏ كمتغير تنبؤي ثان. 


.logistic any date temp 


Logistic regression Number of obs = 23 
LR chi2(2) - 8.09 

Prob » chi2 - 0.0175 

Log likelihood = -11.350748 Pseudo R2 = 0.2627 
any | Odds Ratio Std. Err. 2 P>|z| [95% Conf. Interval] 

date 1.00297 .0013675 2.17 0.030 1.000293 1.005653 

temp .8408309 .0987887 -1.48 0.140 .6678848 1.058561 

_cons 1.19e-06 0000121 -1.34 0.182 2.40e-15 587.9723 





تضمين درجة الحرارة كمتغير تنبؤي طوّر بشكل جزئي معدل. التصنيف 
الصحيح ليكون 078.26 . 


.estat class 
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Logistic model for any 


Classified 





Classified + if predicted Pr(D) >= .5 





True D defined as any !- 0 

— ا‎ 1 110177 
Sensitivity Pr( +| D) 85.71$ 
Specificity Pr( -|-D) 66.67% 
Positive predictive value )عط‎ D| +) 80.00% 
Negative predictive value Pr(-D| -) 75.00% 
ب‎ ee 
False + rate for true ~D Pr( +|~D) 33.33% 
False - rate for true D Pr( -| D) 14.29% 
False + rate for classified + Pr(~D| +) 20.00% 
False - rate for classified - Pr( D| -) 25.00% 
Correctly classified 78.26% 





حسب النموذج odef‏ فإن زيادة درجة الحرارة درجة مئوية واحدة 
يُضاعف احتمالات تلف صواريخ الدفع بمقدار 60.84 بعبارة أخرى» كل 
نقص في درجة باوبا oe‏ احتمالات التلف 
بمقدار %16؛ بالرغم من أن هذا التأثير يبدو قوياً بما فيه الكفاية ليُثير 
الاهتمام» فإن اختبار ع يوضح ob‏ هذا الاحتمال ليس ذا معنوية إحصائية 
p=0.140)‏ ,1.476-=2)» والاختبار الآخر الحاسم ne‏ نسبة الاحتمال 
لاختبار e?‏ الأمر Intest‏ يقوم بمقارنة gila‏ متداخلة يتم تقديرها باس تخدام 
الأرجحية العظمى» حيث يتم Yd‏ تقدير النموذج بالكامل Ley‏ في ذلك كل 
المتغيرات ذات العلاقة كما تم فعله سابقا مع الأمر logistic any date temp‏ ثم 
بعد ذلك نقوم بطباعة الأمر estimates store‏ يليه اسم (بافتر اض أن الاسم هو 
(full‏ لتحديد النموذج الأول: 
.estimates store full‏ 
الآن نقوم بتقدير النموذج المصغر والذي يتضمن فقط مجموعة من 
متغيرات × التي توجد في النموذج الكامل أعلاه (يُطلق على مثل هذه النماذج 
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المصغرة اسم النماذج المتداخلة)» وأخيراً استخدام أمر مثل Irtest full‏ يقوم 

full بتسميقه‎ Wb gill مع الوذ قاق‎ Galata piedi jns el slo 

فعلى سبيل Jid‏ (قمنا باستخدام quietly‏ قبل الأمر logistic‏ أدناهء La‏ 
شاهدنا المخرجات من قبل): 

.quietly logistic any date 

.lrtest full 


Likelihood-ratio test LR chi2(1) = 3.28 
(Assumption: . nested in full) Prob » chi2 - 0.0701 

الأمر Irtest‏ يقوم باختبار آخر Ua sid)‏ أنه متداخل) نموذج مع النموذج 
الذي سبق حفظه بواسطة الأمر estimates store‏ وهو يستخدم إحصائية 
اختبار عامة لنماذج الأرجحية العظمى المتداخلة. 

y= -2(In K - mA) [9.6] 

حيث إن In o6‏ الاحتمال اللوغازيتمي المتوقع للنموذج الأول (مع كل 
متغيرات «(x‏ ها الاحتمال اللوغاريتمي المتوقع للنموذج الثاني (مع 
مجموعة محددة من متغيرات x‏ فقط)» قارن إحصائيات الاختبار الناتجة مع 
توزيع Y‏ مع درجات حرية تساوي الفرق في التعقيد Moe)‏ متغيرات x‏ 
المستبعدة) بين النماذج 1 Oy‏ لمزيد من المعلومات حول هذا الأمر قم 
بطباعة c help Irtest‏ وهذا الأمر يعمل مع أي حسابات لتقدير الأرجحية 
العظمى ببرنامج ستاتا (هذه الأوامر مثل logit, mlogit, stcox‏ والعديد من 
الأوامر الأخرى). وبصفة dle‏ فإن إحصائية # يتم حسابها باس تخدام 
مخرجات الأمر logit‏ أو الأمر logistic‏ (المعادلة رقم ]9.3[( وخصوصاً 
المعادلة رقم [9.6]. 

الأمر Irtest‏ في المثال السابق يقوم بإجراء العملية الحسابية التالية: 

Xl = 2[-12.991096 — (-11.350748)] 
=3.28 

مع درجة حرية 1 سوف يكون لدينا 0.0701 = ص وتأثير المتغير temp‏ 

ذي معنوية إحصائية عند 0.10 = »» وبالأخذ في الاعتبار Lil‏ نقوم باس تخدام 
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عينة صغيرة الحجم والتأثيرات السلبية المحتملة للخطأ من النوع الثاني 
بخصوص السلامة بالمركبة الفضائية فإن 0.10 = a‏ يبدو أنها نقطة تحول 
أكثر دقة من المعتاد عندما تكون 470.05 

الرسم cU‏ للثاثيرات الطشروطة أو الهامشية : 


Marginal or Conditional Effects Plots 





إنشاء رسم بياني للتأثيرات المشروطة أو الهامشية المعدلة يساعد في فهم 
وتوصيل معنى النموذج اللوغاريتمي وتطبيقاته على الاحتمالات. فمثلا يمكننا 
حساب الاحتمال المتوقع لحوادث التلف الحراري كدالة للمتغير temp‏ & 
الحفاظ على المتغير date‏ عند قيم منخفضة (في البداية) أو مرتفعة :سي 

النهاية) نسبياً. 
summarize date temp‏ . 


Variable 





date 25 8505.88 517.6033 7772 9524 
temp 25 68.44 10.52806 Bi 81 


التواريخ الماضية في هذا المدى من البيانات من أول رحلة للمكوك 
الفضاء في 12 أبريل 1981 )7772 (date‏ إلى تاريخ كارثة تشالنجر في 21 
يناير 1986 )9524 = «date‏ درجات الحرارة تتراوح ما بين 31 إلى 81 
درجة فهرنهايتيةء الأمر margins‏ يمكنه إجراء الحسابات» بينما الأمر 
marginsplot‏ يمكنه إنشاء الأشكال البيانية للتوقعات المحتملة للنموذج الذي تم 
الحصول عليه من الأمر logistic‏ عند زيادة درجة الحرارة 10 درجات عند 

تواريخ البداية والنهاية. 
.quietly logistic any date temp‏ 


-margins, at(temp = (30(10)80) date = (7772 
9524)) vsquish 
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Adjusted predictions Number of obs z 23 
Model VCE : OIM 
Expression : Pr(any), predict() 
1. at : date = 7772 
temp = 30 
2. at : date = 7772 
temp = 40 
3. at : date = 71172 
temp = 50 
4. at : date - 7772 
temp = 60 
5: Bit : date = 7712 
temp = 70 
6. at : date = 7172 
temp = 80 
عق‎ : date - 9524 
temp z 30 
8. at : date = 9524 
temp = 40 
9. at : date 3 5524 
temp = 50 
10. at : date = 9524 
temp = 60 
11._at : date = 9524 
temp = 70 
12. at : date = 9524 
temp = 80 













Delta-method 


Std. Err, [95$ Conf. Interval] 





l 
[7] 
et 


1 .985239 -0624661 15,77 0.000 -8628077 1.10767 
2 .9218137 .2310152 3.99 0.000 .4690321 1.374595 
3 - 6755951 . 4831333 1.40 0.162 -.2713288 1.622519 
4 .2689325 .291999 0.92 0.357 -.3033749 .84124 
5 .0610143 .0871295 0.70 0.484 -.1097563 .2317849 
6 .0113476 .0255353 0.44 0.657 -.0387006 .0613958 
7 .9999169 .0004545 2200.25 0.000 -9990262 1.000808 
8 .99953 0020277 492.94 0.000 .9955558 1.003504 
9 -9973449 .0084046 118.67 0.000 .9808722 1.013818 
10 .9851528 .0302581 32.56 0.000 .9258479 1.044458 
11 .9213867 -0808455 11.40 0.000 . 7629324 1.079841 
+ 6742985 .2166156 3.11 0. . 8 1.098857 








.marginsplot 
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Adjusted Predictions with level(95)% Cis 


Mice 


70 80 
Joint oo dete 8 


—*®— date=12apr1981 جلها‎ date-28jan1986 


الشكل (2.9) 


Pr(Any) 


الو = rii‏ اضي 2 marginsplot‏ بالشكل )9 .2( يو gea‏ ا مات 
للنشر» Lig‏ متع ظهور فثرات uh ce Af‏ الخيار ME uted‏ 
شرح الرسم واستخدام الخيار plotZopts()‏ لإظهار المنحنيين وإضافة عنوان» 
Yá‏ سوف نقوم باستخدام الأمر margins‏ مع زيادة درجة الحرارة 4a‏ 
وأحدة» وهذه الزيادة سوف تجعل المنحنيات الناتجة 3 تجة أكثر Tia‏ 
.quietly margins, at(temp = )30)1(80( date -‏ 
))9500 8000( 
marginsplot, noci legend(position(7) ring (0)‏ 
rows(2))‏ 
plotiopts(msymbol(i) lpattern(dash)‏ 
lwidth (medthick) )‏ 
plot2opts(msymbol(i) lpattern(solid)‏ 
lwidth(medthich))‏ 
title("Predicted probability of booster O-ring‏ 
damage")‏ 
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Predicted probability of booster O-ring damage 









----- date=26nov1981 ES 
date=04jan1986 


~ 
ELS 


30 40 


50 60 
Joint temperature, degrees F 


الشكل )3.9( 


oly‏ على نموذجنا اللوغاريتمي» فإنه بالقرب من وقت البداية لرحلة 
مكوك الفضاء (المنحنى المتقطع في الشكل أعلاه) احتمال التلف الحراري 
يتجه من القرب من الصفر عند درجة حرارة 80 F‏ إلى أقل من 40 *F‏ ' 
تقريباًء وبحلول وقت رحلة تشالنجر (المنحنى المتصل في الشكل أعلاه). فإن 
احتمال أي تلف حراري يزيد عن 0.6 حتى في الأجواء الحارة» ويصل إلى 
1 في الرحلات التي تكون فيها درجة الحرارة 70 PF‏ ويجب ملاحظة أن 
درجة الحرارة الفعلية لمكوك الفضاء تشالنجر عند DULY!‏ كانت 31 °F‏ 
والتي يمكن وضعها في أعلى اليسار بالشكل (3.9). 
الرسومات daa‏ التشخيصية والإحصائيات التشحيصية: 

Diagnostic Statistics and Plots 
فإن تأثير الانحدار اللوغاريتمي والإحصائيات‎ dale كما أشرنا‎ 


التشخيصية التي يمكن الحصول lele‏ عن طريق استخدام الأمر Y predict‏ 
تشير إلى مشاهدات فردية LS‏ يحدث في حالة الإحصائيات التشخيصية 
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ار OLS‏ في الفصل (7). وبدلا من ذلك» فإن التشخيصات اللوغاريتمية 

تشير إلى أنماط متغيرات ×. وفي بيانات مكوك الفضاء فإن كل نمط لمتغير x‏ 

لا نظير Cus «A!‏ لا توجد رحلتان تشتركان في نفس التاريخ date‏ ودرجة 

الحرارة د . (وهذا طبيعي حيث لم يتم إطلاق رحلتين في نفس Casall‏ 
وقبل predict t" "ad‏ سوف نقوم بإعادة حساب آخر نموذج. 

.quietly logistic any date temp 

.predict Phat3 

.label variable Phat3 "Prec ability" 

‘predict dX2, dx2 

-label variable dX2 "Change in Pearson chi- 

squared’ 

‘predict dB, dbete 

.label variable dB "Influence" 

‘predict dD, ddeviance 

-label variable : ^ “hange in deviance" 





تشير دراسة Hosmer and Lemeshow‏ )00 ان الرسومات البيائنية 
تساعد في قراءة الإحصائيات التشخيصية؛ ولإنشاء es)‏ بياني للتغير في X‏ 
لبيرسون مع احتمال التلف الحراري (الشكل 4.9( نقوم بطباعة الأمر التالي: 
.graph twoway scatter dX2 Phat3‏ 


4 6 8 10 


Change in Pearson chi-squared 


2 
© 


oto 
e 
e 
5 e © ® مس مه‎ Oa 
T Se a eas 7 ae ae d — 7 
0 2 4 6 8 1 
Predicted probability 


الشكل )4.9( 
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هناك نمطان اثنان للمتغيرات x‏ يتناسبان بشكل ضعيف وهذا واضح في 
أعلى اليمين واليسار بالشكل (4.9) حيث تبرز هاتان النقطتان بوضوح» 
يمكننا تحديد الرحلات التي لها قيم dX2‏ مرتفعة بالعين المجردة من خلال 
رقم الرحلة flight‏ للتوصيف)» في الشكل )5.9( سوف يتم توصيف الرحلات 
التي يكون فيها 2 Lä qX2»‏ وذلك بوضع هذه التوصيفات فوق شكل 
الانتشار (إذا قمنا بإضافة توصيفات لكل النقاط بالرسم «uic‏ فإننالن 
نستطيع قراءة الجزء السفلي من البيانات التي تكون فيها النقاط متقاربة). 

.graph twoway scatter dX2 Phat3 

|| scatter  dx2  Phat3 if  dX2» 2, 

mlabel(flight) 


mlabsize(medsmall) 
|| , 1egend(off) 


o 
e STS-2 
go 
S 
2 
> 
E 
L 
Sc eSTS 51-A 
o 
2 
oO 
& 
e 
o 
D 
c 
g 
Oo eSTS 51-J 
ليك‎ 
e ° e 
o e 9 ° * موه‎ e 
—— A Te ————p—Á-—c 
0 2 4 & 8 1 
Predicted probability 
(5.9) الشكل‎ 


.list flight any date temp dX2 Phat3 if dX2» 2 
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flight 


2. 12nov1981 9.630337 .1091805 
4. 9 27jun1982 $ .0407113 
14. = 08nov1984 5.899742 .8400974 
21. 030ct1985 2.124642 .6350927 
25. STS 51-L š 28jan1986 . .9999012 





الرحلة 51-4 545 لم تعان من أي تلف حراري بالرغم من تأخر تاريخ 
إطلاقهاء وانخفاض درجة الحرارة (انظر الشكل 2.9( النموذج يتوقع أن 
4 احتمال وقوع تلف حراري لهذه الرحلة. كل النقاط التي تقع في 
الجانب الأيمن بالشكل )5.9( لم تعان من أي تلف حراري )0 = (any‏ ولكن 
في أعلى اليسار )1 = (any‏ الخاصة بالرحلة STS-2‏ عانت من تلف حراري 
بالرغم من أنها واحدة من الرحلات الأولى» وتم إطلاقها في جو معتدل» 
النموذج يتوقع ob‏ 0.109 احتمال وقوع تلف» وحيث إن ستاتا يعتبر القيم 
المفقودة أعلى قيم» فإنه يقوم بوضع القيمتين المفقودتين للرحلات بما فيها 
رحلة تشالنجر ضمن نطاق البيانات 2 < 4×2. 

نفس النتائج تم الحصول عليها من الرسم البياني للمتغير dD‏ مع 
الاحتمال المتوقع كما هو معروض في الشكل (6.9). ومرة «eg Al‏ فإن 
الرحلتين ۳-2 (أعلى اليسار) 5 STS 51-A‏ (أعلى اليمين) تبرزان وتتناسبان 
بشكل ضعيف مع النموذج» الشكل )6.9( يوضح التباين في شكل الانتشار 
للنقاط التي تم توصيفهاء وبدلاً من وضع رقم الرحلة بالقرب من النقاط كما 
فعلنا في الشكل (5.9) سوف نقوم بإخفاء النقاط نفسها عن طريق الخيار 
msymbol(i)‏ ونضع توصيفات في مكان النقاط عن طريق الخيار 
mlabposition(0)‏ لكل نقطة ally‏ في الشكل (6.9). 


.graph twoway scatter dD Phat3, msymbol(i) 
mlabposition(0)mlabel(flight) mlabsize(small) 
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STS-2 


STS_51-A 


4 


3 


STS_51J 


Change in deviance 
2 


STS_51-F 
STS$rs.9 


STS_41-G 
55 S6 





4 6 
Predicted probability 


الشكل )6.9( 
المتغير 48 يقوم بقياس تأثير las‏ متغير × في الانحدار اللوغاريتمي» 
الشكل (7.9) له نفس تصميم الشكل (6.9) ولكن يعرض النقاط على شكل 
دوائر حسب تأثيرها. الشكل يوضح بأن هناك مشاهدتين هما أسوأ المشاهدات 
وهما الأكثر تأثيرا. 
¿graph twoway scatter dD Phat3 [aweight = dB],‏ 
msymbol (oh)‏ 


TK 


O 


3 


Change in deviance 
2 


,9 


$9 o 


1 


= T qoo p 


4 6 
Predicted probability 


الشكل )7.9( 
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المشاهدات التي تتناسب بشكل ضعيف ولها تأثير كبير تستحق عناية 
خاصة لأنها تتعارض مع النمط العام للبيانات والنموذج المستخرج يتوقع 
اتجاهها المختلف» وبالطبع فإن استيعاد مثل تلك القيم المتطرفة يسمح لنا 
بالحصول على نموذج أكثر تناسباً مع بقية البيانات» ولكن هذا ما تعرضه 
الأشكال الدائرية بالرسم» ردة الفعل الأكثر قبولاً هو التحقق من سبب ظهور 
القيم المتطرفة فلماذا رحلة مكوك الفضاء STS-2‏ وليست STS 51 im‏ 
عانت من تلف أثناء الإطلاق؟ البحث عن إجابة لهذا السؤال قد تقود المحققين 
إلى النظر في المتغيرات السابقة. 
الانحدار اللوغاريئمي مع الفئة y abl‏ : 
Logistic Regression with Ordered-Category y‏ 
الأمر logit‏ والأمر logistic‏ يتناسیان مع نماذج لها متغيرات» وهذه 
المتغيرات لها نوعان من المخرجات يتم ترميزهما 0 و1» ونحن نحتاج إلى 
طرق أخرى للنماذج التي يأخذ فيها المتغير ر أكثر من قيمتين. الاحتمالان 
المهمان هما الانحدار اللوغاريتمي المتعددء أو المرتب: 
mlogit‏ الانحدار اللوغاريتمي المتغدد: الذي يكون فيه المتغير SLB AT y‏ 
متعددة ولكنها غير مرتبة مثل )71 ديمقراطي «Democrat‏ 2= 
جمهوري «Republican‏ 3= أخرى (other‏ 
ologit‏ الانحدار اللوغاريتمي المرتب: الذي يكون فيه المتغير رمتغيرا 
ترتيبياً (فئة (Ag ja‏ القيم الرقمية تمثل فئات ليست ذات أهمية إلا إذا 
كانت الأرقام الأعلى تشير إلى الكثرة؛ مثلا فئات المتغير By‏ تشير 
إلى )1= «fair siia =2 spoorse‏ 3= ممتاز (excellent‏ 
قمنا سابقاً بتحديد المخرجات الثلاثة للمتغير الترتيبي distress‏ في 
تفرعات للمتغير cany‏ الأمر logit‏ والأمر logistic‏ يتطلبان متغيرات تابعة لها 
قيمتان )0,1(- ومن «c os] iali‏ فإن الأمر ologit‏ تم تصميمه للمتغيرات 
الترتيبية التي لها أكثر من قيمتين» دعنا نقول بأن المتغير distress‏ له عدة 
مخرجات هي 0- "لا et‏ 1-"1 أو 02 2-"3 أو أكثر" وهي تشير إلى 
حوادث التلف بصواريخ الإطلاق. 
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الانحدار اللو غاريتمي المرة تب يشير إلى o‏ المتغير 6 والمتغير temp‏ 
كليهما يؤثر في المتغير distress‏ بنفس الإشارات (موجب لمتغير edate‏ سالب 
لمتغير (temp‏ كما شاهدنا سابقا في التحليل اللوغاريتمي الثنائي: 


.Ologit distress date temp, nolog 


Ordered logistic regression Number of obs = 23 
LR chi2(2) = 12.32 
Prob > chi2 = 0.0021 
Log likelihood = -18.79706 Pseudo R2 z 0.2468 





Coef. Std. Err. z P>|z| (95% Conf. Interval] 









distress 











. 003286 . 0012662 2.60 0.009 . 0008043 .0057677 
-.1733752 .0834475 -2.08 0.038 -.3369293 -.0098212 


date 
temp 


16.42813 9.554822 -2.298978 35.15524 


/cut2 18.12227 9.722202 -.933092 37.17763 


اختبارات نسب الاحتمال أكثر دقة من اختبارات z‏ المقاربةء أولاً يجب 
استخدام الأمر estimates store‏ مع النتائج المحفو ظة في الذاكرة ة من النموذج 
الكامل (مع متغيرين تنبؤيين) والذي ثم حسابه las‏ يمكننا إعطاء هذا 
النموذج أي aul‏ توصيفي وليكن اسمه date temp‏ 
.estimates store date temp‏ 
ثم بعد ذلك القيام بإنشاء نموذج أكثر بساطة بدون المتغير Bin y temp‏ 
نتائج النموذج el os]  notemp. aul‏ اختبار نسبة الاحتمال لمعرفة ما إذا كان 
النموذج notemp‏ يختلف بدرجة كبيرة عن النموذج الكامل date temp‏ 


.quietly ologit distress date 
-estimates store notemp 
.lrtest notemp date temp 


Likelihood-ratio test LR chi2(1) = 6.12 
(Assumption: notemp nested in date_temp) Prob > chi2 = 0.0133 


وتجدر الملاحظة أن Gla de‏ الأمر Irtest‏ وافتراضه يشيران إلى أن 
نموذج notemp‏ يتداخل مع نموذج «date, temp‏ و هذا يعني أن ciudad‏ التي 
تم تقدير ها في نموذج notemp‏ هي عبارة عن de gene‏ فرعية من معلمات 
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نموذج date. temp‏ وكلا النموذجين تم تقديرهما من نفس مجموعة المشاهدات 
(والتي يمكن أن تكون معقدة عند احتواء البيانات على قيم مفقودة). اختيار 
الأرجحية العظمى يشير إلى أن نموذج notemp‏ يتناسب بشكل ضعيف das‏ 
وحيث إن وجود المتغير temp‏ كمتغير تنبؤي في نموذج date temp‏ هو 
الاختلاف الوحيد لذلك» فإن اختبار الأرجحية العظمى يوضح Gh‏ مساهمة 
temp pi‏ في النتائج هي مساهمة ذات أهمية كبيرة. وهناك خطوات 
أخرى مشابهة تؤكد بأن متغير date‏ له تأثير ذو معنوية. 

quietly ologit distress temp 


.estimates store nodate 
.lrtest date temp: 


Likelihood-ratio test LR chi2(1) = 10.33 
(Assumption: nodate nested in date temp) Prob > chi2 = 0.0013 





الأمر estimates store‏ والأمر Irtest‏ يعتبران أدوات مرنة لمقارنة نماذج 
الأرجحية العظمى. وللحصول على مزيد من التفاصيل عن هذه الأوامر 
والخيارات المصاحبة لهاء قم بطباعة الأمر help Irtest‏ أو الأمر -help estimates‏ 


النموذج اللوغاريتمي المرتب يقوم بتقدير نتيجة 5 لكل salis‏ حيث إن 
كل مشاهدة تكون Alla‏ خطية للمتغير date‏ والمتغير stemp‏ 
S = 0.003286date — 0.1733752temp‏ 
الاحتمالات المتوقعة تعتمد على قيمة 5 زائداً الاضطراب الموزع 
اللوغاريتمي u‏ الاقتراب من نقاط القطع المقذرة (المعروضة في مخرجات 
الأمر ologit‏ باستخذام cut2 «cut].‏ ... الخ). 
P(distress =“none”) = P(St+u< cutl)‏ 
exp(-cut! + S))"‏ + 1( = 
P(distress = “1 or 2”) = P(cutl <S + u < cut2)‏ 
exp(-cut2 + S))" Û (1 + exp(-cut1 + S)!‏ +1( = 
P(distress = “3 plus”) = P(cut2 «S + u)‏ 
exp(-cut2  5))!‏ + 1( 11= 
بعد إجراء حساب الاحتمالات المتوقعة باستخدام الأمر ologit‏ والأمر 
predict‏ لكل AS‏ من فئات المتغير التابع» نقوم بإعطاء أسماء لكل الاحتمالات 
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التي تم حسابها بالأمر predict‏ فمثلاً الاسم none‏ قد يشير إلى احتمال عدم 
وجود حادث تلف (الفتة الأو لى لحوادث التلف «(distress‏ والاسم threeplus‏ 
يشير لثلاثة حوادث تلف أو أكثر (ثالث وآخر فئة لحوادث التلف (distress‏ 


-quietly ologit distress date temp 
.predict none onetwo threeplus 


هذا يقوم بإنشاء ثلاثة متغيرات جديدة: 


.describe none onetwo threeplus 





storage display value 
variable name type format label variable label 
none float %9.0g Pr(distress==0) 
onetwo float %9.0g Pr(distress--1) 
threeplus float 59.06 Pr(distress--2) 


الاحتمالات المتوقعة لآخر رحلة لمكوك الفضاء تشالنجر - وهى 
المشاهدة رقم 25 ي هذه البيانات - متذبذبة. 
.list flight none onetwo threeplus if flight ==25‏ 


flight onetwo threep-s 


"25. STS 51-L .0000754 .0003346 .99959 





النموذج الذي قمنا بإنشائه يعتمد على تحليل 23 رحلة تسبق رحلة تحطم 
مكوك تشالنجرء ويعطي احتمالاً ضئيلاً )0.000075 = gh (p‏ المكوك تشالنجر 
موقت لق dad uy‏ كلقا le Lalas‏ واحتمال أكثر ضآلة بحادث 3 اثنين 
(p = 0.003)‏ ولكن الاحتمال الواضح والمؤكد )0.9996 = (p‏ لوقوع AAD‏ 
حوادث تلف أو أكثر. 

للحصول على مزيد من التفاصيل عن التقنيات المتعلقة بهذا النوع من 
التحليل» انظر دراسة Long‏ )1997( ودراسة LS (2000) Hosmer and Lemeshow‏ 
أن دليل المستخدم the Reference Manual‏ يشر ¢ تطبيقات برنامج ستاتا المتعافة 
بهذا المو ضوع. so‏ إلى ذلك فإن دراسة Long and Freese‏ )2006( تعرض 
Uus‏ أكثر Await‏ وتشرح الخيارات المتوافرة عن القيام بهذا التحليل عن طريق 
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استخدام الملفات التنفيذية cdo-files‏ كما توضح بعض التفسيرات المفيدة وأوامر ما 
قبل التقدير مثل اختبأرات Brant‏ ولتثبيت هذه الأوامر التنفيذية المجانية من 
الإنترنت قم بطباعة الأمر findit brant‏ ثم اتبع الرابط الذي يرشدك إلى مصادر 
تلك الملفات التنفيذية. 


Multinomial Logistic Regression : sibl اللوغاريتمي‎ just 





إذا كانت فئات المتغير التابع غير ترتيبية» فإن الانحدار اللوغاريتمي 
المتعدد (يُسمى أيضاً الانحدار اللوغاريتمي متعدد التدريج) يوفر أدوات 
مناسبة؛ فإذا كان المتغير ر له فئتان» فإن الأمر mlogit‏ والأمر ologit‏ كليهما 
يتناسب مع نفس النموذج LS‏ يحدث مع الأمر „logistic‏ إلا أن نموذج الأمر 
mlogit‏ أكثر Jass‏ 

تظهر المتغيرات التابعة ذات الفئات المتعددة عادة في بيانات الدراسات 
الاستقصائية؛ فمثلاً بيانات استقصاء جرانيت توضح ذلك. 


.use C:\data\Granite2011_6.dta, clear 
-describe age sex educ party warmop2 warmice 





storage display value 
variable name type format label variable label 
age byte $9.0g age Age of respondent 
sex byte $9.0g sex2 Gender 
educ byte %14.0g educ Highest degree completed 
party byte $11.0g party Political party identification 
warmop2 byte $9.0g yesno Believe happening now/human 
warmice byte $9.0g warmice2 Arctic ice vs. 30 years ago 


رأينا في الفصل )4( أن الاستطلاع يتضمن ثلاثة أسئلة رئيسة حول 
المناخ cha‏ المتعلقة بالمتغير 'warmice‏ 

أي من العبارات الثلاث التالية تعتقد أنها أكثر دقة؟ 

خلال السنوات القليلة الماضية» جليد القطب الشمالي في آخر فصل 


- غطى أقل مساحة عن تلك التي كان يغطيها في السنوات 30 


الماضية. 
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— انخفض ولكنه عاد ليغطي نفس المناطق التي كان يغطيها في 30 
Aia‏ الماضية: 
- يغطي مناطق أكثر من تلك التي كان يغطيها في 30 سنة الماضية. 
هذه البيانات تم اعتبارها بيانات دراسة استقصائية باستخدام الأمر svyset‏ 
(انظر الفصل 4(« وهذه البيانات توضح معلومات عن الأوزان (bal y‏ 
E yal Ny‏ تستشيع كلها avy‏ موف تقوم UU‏ بتطبيق هذه الماومسات: 
cud Wid‏ الردود الموزونة للمتغير 6 مم الحصول عليها كما يلي: 
.Svy: tab warmice, percent‏ 


(running tabulate on estimation sample) 













Number of strata  - al Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 
Arctic 
ice vs. 
30 years 
ago percentages 
Less . 
Recovere 10.43 
More 6.916 
DK/NA 11.75 
Total 
Key: percentages = cell percentages 


حوالي %71 من الذين شاركوا في الاستطلاع أجابوا بأن هناك انخفاضاً 
في جليد المنطقة الشمالية» وأن نسبة %12 فقط قالوا بأنهم لا يعرفون أو لم 
يقوموا بالإجابة. 

المتغير الثاني الذي يهمنا يشير إلى ما إذا كان المشاركون في الدراسة 
يعتقدون بأن التغير المناخي يحدث في الوقت الحاضر وس ببه الأنشطة 
البشرية (warmop2)‏ حوالي %55 يعتقدون أن هذه العبارة صحيحة. 


.Svy: tab warmop2, percent 
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(running tabulate on estimation sample) 






Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 
Believe 
happening 
now/human percentages 
Key: percentages = cell percentages 


إجابات السؤال المتعلق بالمتغير warmice‏ ترتبط مع الاعتقاد بوجود 
التغير المناخي» كما نرى في الجدول ذي الاتجاهين alid‏ مع Ay gis ied‏ بناءً 
على متغير الصف بالجدول و هو ovarmop2‏ نسبة الإجابات الدقيقة الخاصة 
بالمتغير warmice‏ كانت %83 وهم الذين يعتقدون أن الإنسان يتسبب في 
تغييرات في المناخ» ولكن 6 فقط لا يعتقدون cll‏ أما الإجابة المخالفة 
للواقع» وهي أن الجليد في آخر فصل صيف بالمنطقة القطبية الشمالية غطى 
نفس المناطق التي كان يغطيها منذ 30 سنة مضت. . هذه الإجابة كانت أربع 
مرات أكثر شيوعاً بين الذين لا يعتقدون أن الإنسان يتسبب في تغييرات في 
المناخ» هذه الاختلافات ذات معنوية إحصائية عند )0.0000 = «(p‏ 


.Svy: tab warmop2 warmice, row percent 


(running tabulate on estimation sample) 


Number of strata = 4 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 







Believe 
happening 
now/human 





Arctic ice vs. 30 years ago 
Less Recovere More DK/NA Total 













17.81 
Yes 83.1 4.354 6.887 5.654 100 
Total 70.91 10.43 6.916 11.75 100 


Key: row percentages 


Pearson: 
Uncorrected chi2(3) = 55.2306 
Design-based F(3.00, 1544.45)- 14.6772 P = 0.0000 
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الفصل )4( يعرض الأمر catplot‏ الذي يساعد في إنشاء رسومات بيانية 
للمتغيرات dye sil‏ الأمر catptot‏ لا يتم تثبيته افتراضياً مع برنامج ستاتاء ولكن 
يجب تحديده وتحميله عن طرين طباعة الأمر cfindit catplot‏ باستخدام الأمر 
catplot‏ يمكننا إنشاء أعمدة بيانية تتعلق بالجدول الثنائي أعلاهء عند اعتبار 
المتغيرالموزون الاحتمالي censuswt‏ كأو زان تحليلية olè ([aw=censuswt})‏ النتائج 
في الأعمدة البيانية سوف تتشابه مع النسب الناتجة من الأمر svy: tab‏ 
.catplot hbar warmice [aw-censuswt],‏ 
over(warmop2)percent (warmop2)‏ 
blabel (bar, format(%2.0f))  ytitle("Weighted‏ 


percent") 
title("Arctic sea ice by humans changing 


climate’) 
Arctic sea ice by humans changing climate 
Less 
- Recovered 
> No 
p4 More 
S 
S DK/NA 
eo 
e 
6 
> 
g Less 83 
e 
5 Recovered 
چ‎ Yes 





1 SS 


0 20 60 80 


40 
Weighted percent 


الشكل )8.9( 


الشكل )8.9( يشبه جدول النسب» واختبار oF‏ حيث يعرض العلاقة بين 
الاعتقادات والحقائق حول المناخ. يمكنك فحص ما إذا كانت هناك أنماط 
متشابهة ظهرت مع السؤالين الرئيسين في استطلاع الر «sl‏ المتغير warmco2‏ 
(الاتجاهات في (CO;‏ والمتغير warmgre‏ (تأثير الصوبات الزجاجية)؛ التفسير 
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التقليدي لمثل هذه الأنماط هو أن المعرفة توفر معلومات لمن لديهم اعتقادات 
حول المناخ» وفي هذه الحالة معرفة حقائق محددة حول المناخ توضح ما إذا 
كان الناس يعتقدون أن الإنسان يتسبب في تغير المناخ. وعموماً فإن بحوث 
العلوم الاجتماعية التي تم إجراؤها حديثا وجدت دليلا على علاقة سببية في 
الاتجاه المعاكس» بعض الناس يقبلون حقيقة محددة أو حقائق خاطئةء Ley‏ 
تتناسب مع اعتقاداتهم عموماً. 

وللاستمرار مع هذه الفرضيات (اصطلاح "الاستيعاب المتحيّز") يمكننا 
تحليل الردود على المتغير warmice‏ باعتباره متغيرا تابعا. المتغيرات التنبؤية 
المحتملة تتضمن العمر والجنس والتعليم ووجهة النظر السياسية. وعادة فإن 
هذه المتغيرات التنبؤية ترتبط مع وجهات النظر المتعلقة بالبيئة. في بيانات 
الدراسة الاستقصائية الموجودة لدينا متغير العمر age‏ يحتوي على سنوات» 
ومتغير الجنس sex‏ يحتوي على الرقم 0 للذكور والرقم 1 «UD‏ ومتغير 
التعليم educ‏ يتراوح ما بين الرقم 1 للتعليم الثانوي أو أقلء إلى الرقم 4 
للدراسات العلياء أما متغير الانتماء السياسي party‏ يتضمن الرقم 1 
للديمقراطيين والرقم 2 للمستقلين والرقم 3 للجمهوريين. 


-describe age sex educ party warmop2 warmice 





storage display value 
variable name type format label variable label 
age byte $9.0g age Age of respondent 
sex byte $9.0g sex2 Gender 
educ byte $14.0g educ Highest degree completed 
party byte $11.0g party Political party identification 
warmop2 byte $9.0g yesno Believe happening now/human 
warmice byte %9.0g warmice2 Arctic ice vs. 30 years ago 


كيف تؤثر هذه العوامل على ردود المشاركين حول الأسئلة المتعلقة 
بالمتغير fwarmice‏ هل الاعتقادات السائدة حول التغير المناخي يمكنها أن 
تساهم في توقع الإجابات إذا ما قمنا بالتحكم في التعليم والانتماء السياسي؟ 
نتائج الأمر mlogit‏ أدناه تعطي بعض الإجابات عن هذه الأسئلة. 


-Svy:  mlogit  warmice age sex educ party 
warmop2, rrr base(1) 
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(running mlogit on estimation sample) 

Survey: Multinomial logistic regression 

Number of strata  - 1 Number of obs = 486 

Number of PSUs = 486 Population size = 485.77734 
Design df = 485 
F( 15, 471) = 4.54 
Prob > F = 0.0000 











(95% Conf. Interval 


Linearized 
Std. Err. 


RRR 


(base outcome) 








warmice 


Recovered 


age 1.001732 .0110398 0.16 0.875 .9802738 1.023661 

sex - 6975992 - 2518093 -1.00 0.319 .3432281 1.417846 
educ .8860304 .1491035 -0.72 0.472 .6365725 1.233245 
party 1.718036 .4143614 2.24 0.025 1.069604 2.759569 
warmop2 .239992 .1098955 -3.12 0.002 .097599 .590131 
cons .1196324 .1170444 -2.17 0.030 .0174976 .8179363 















age 1.023417 .014' 491 1.61 0.109 .9948431 1.052811 

sex .5854667 .2578116 -1.22 ` 5 .2464541 1.390812 
educ .5378248 .0936788 -3.56 0.000 .3819503 .7573119 
party 1.169189 .3220132 0.57 0.571 .6805561 2.008656 
warmop2 1.270082 .6225808 0.49 0.626 .4847726 3.327558 
_cons - 0833092 . 0846524 -2.45 0.015 .0113137 .6134542 









age .9866127 .0109802 -1.21 0.226 .9652723 1.008425 

sex 1.253388 .4430697 0.64 0.523 .625799 2.51036 
educ .8338215 .1369808 -1.11 0.269 .6037919 1.151487 
party 1.707791 .3624779 2.52 0.012 1.125423 2.591516 
warmop2 .2443751 .1004212 -3.43 0.001 .1089927 .5479193 
_cons - 2678258 - 2778029 -1.27 5 0348926 2.055758 









هذا المثال يستخدم أوزان بيانات الدراسة الاستقصائية. تركيبة الأمر 
أعلاه يمكن أن تتشابه (ولكن بدون استخدام svy‏ قبل الأمر) إذا لم نستخدم 
بيانات دراسة استقصائية» الخيار base(1)‏ يحدد الفئة 1 ('مناطق أقل" - 
0 التي يُفترض أن تكون نتيجة أساسية للمقارنةء وبذلك فإن الجدول 
المعروض أعلاه يعرض المتغيرات التنبؤية لثلاث إجابات خاطئة مختلفةء Ld‏ 
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الخيار rrr‏ يطلب من الأمر mlogit‏ أن يعرض نسب المخاطرة النسبية» والتي 
تشبه نسب الاحتمال التي يمكن الحصول عليها بالأمر logistic‏ | 

وبصفة Ale‏ فإن نسب المخاطرة النسبية للنتيجة ر الخاصة بالمتغير بر 
والمتغير التنبؤي xy‏ تساوي نسبة الاحتمال المتوقعة لصالح y = j‏ (مقارنة مع 
"النتيجة الأساسية" = (y‏ المضروبة في OL‏ وحدة نقص واحدة في #دمع 
ثبات العوامل الأخرى. بعبارة cog yah‏ فإن نسبة المخاطرة النسبية rrr,‏ عبارة 
عن المضروب في Alla‏ أن جميع متغيرات × عدا JES x,‏ بنفس قيمتها. 


T P(y-j|x,;) 5 P(y-j|x,*l) 
^ P(ysbase|x,)  P(y-base|x,*1) 


نسب المخاطرة النسبية في المثال أعلاه تشرح التأثير المضاعف لزيادة 
وحدة واحدة في كل متغير تنبؤي على احتمال اختيار إجابة معينة خاصة 
بالمتغير Yay warmice‏ من فئة أساسية (إجابة صحيحة) وهي الإجابة 'مناطق 
"Ji‏ 

إننا نرى أن الجمهوريين لهم تأثير ذو معنوية إحصائية )0.025 = (p‏ أكثر 
احتمالاً ليعتقدوا بأن الجليد عاد من cas d ere‏ يعتفت دون أن cod‏ 
بشرية وراء التغير المناخي هم Laf‏ لهم تأثير ذو معنوية إحصائية 
(p = 0,002)‏ أقل احتمالاً ليعتقدوا Le‏ يعتقده الجمهوريون. وفي حال ثبات 
العوامل الأخرىء فإن احتمالات أن أحد الجمهوريين ستكون إجابته أن alal‏ 
عاد إلى مستوياته السابقة (بدلاً من تغطية مناطق (J‏ هي %72 أعلى 
(مضروبة في 1.72( بالمقارنة مع المستقلين» لسعب %196 
(مضروبة في 2.96-1.722) من الديمقراطيين» LÍ‏ الذين يعتقدون أن التغير 
المناخي يحدث حالياً نتيجة الإنسان هم 9676 أقل احتمالاً (مضروبة في 
4 لتكون إجابتهم أن الجليد عاد إلى مستوياتة السابقة بدلا من اتخفاضه. 





الجزءان الثاني والثالث من الجدول يعرضان مخرجات الأمر mlogit‏ 
التي توضح نسب المخاطرة النسبية لصالح كل من الردود الأخرى للمتغير 
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+6 بالمقارنة مع من 'يغطي مناطق أقل الإجابة التي D‏ بأن جلي د 
القطب الشمالي يغطي مناطق أكثر من تلك التي كان يغطيها خلال 30 سنة 
ماضية هي إجابة مفضتلة من قبل المشاركين الأقل تعليماء واحتمالات 
الحصول على هذه الإجابة انخفض بنسبة 9646 (مضروبة في 0.54) مع كل 
زيادة بمقدار وحدة واحدة في متغير educ‏ مع ثبات العوامل الأخرى. وعليه؛ 
فإن هذه الإجابة base"‏ الجليد ليغطي مناطق أكثر" لها متغيرات تنبؤية تتعلق 
بالمعتقدات أو الانتماء السياسيء بينما الإجابة oh‏ "الجليد يغطي مناطق أكثر 
من ذي قبل" تبدو أنها تعكس عدم المعرفة (gal‏ المشارك في Aol yall‏ أما 
إجابة "لا أعرف" أو "عدم الحصول على إجابة" (DK/NA)‏ لها علاقة 
بمتغيرات تنبؤية تتعلق بالمعتقدات أو الانتماء السياسي» وربما تشير إلى نوع 
من الرفض للسؤال. 

الأمر margins‏ والأمر marginsplot‏ يمكنهما تمثيل النتائج «Lala‏ 
الأوامر أدناه تقوم بإنشاء رسم بياني تقريبي (الشكل 9.9) يعرض الاحتمالات 
المتوقعة بأن تكون الإجابة عن المتغير warmice‏ هي 'مناطق “less area” "Jal‏ 
كدالة للاعتقادات عن المناخ (warmop2)‏ و الانتماء السياسي ely‏ على النموذج 
السابق للأمر «mlogit‏ وعند إضافة الخيار predict(outcome(1))‏ للأمر 
margins‏ يجعلنا نركز على نتيجة المتغير التابع 'مناطق أقل" “less area”‏ 


.margins, at(party = (1 2 3) warmop2 = (1 0)) 
vsquish predict (outcome (1) ) 





Delta-method 

Margin Std. Err. z P>|z| [95% Conf. Interval] 

-at | 
1 . 8607879 .0250921 34.31 0.000 .8116084 .9099675 
2 .7289992  .0544082 13.40 0.000 .622361 .8356373 
3 .8143384  .0286563 28.42 0.000 .7581732 .8705037 
4 .626633  .0416184 15.06 0.000 .5450624 .7082036 
5 .7500431  .0495879 15.13 0.000 .6528526 .8472336 
6 .5072642  .0445321 11.39 0.000 .419983 .5945455 
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Predictive margins Number of obs 
-Model VCE : Linearized 
Expression : Pr(warmice==Less), predict(outcome(1)) 
1l..at : party = 1 
warmop2 = 1 
2..at : party = 1 
warmop2 = 0 
3._at : party = 2 
warmop2 - 1 
4. at : party = 2 
warmop2 = 0 
5. at : party = 3 
warmop2 = 1 
6._at : party = 3 
warmop2 = 0 


. Marginsplot 


Predictive Margins with level(95)% Cls 


Less) 
8 


Pr(Warmice==! 
6 7 


5 


Democrat Independent Republican 
Political party identification 


الشكل )9.9( 
ولإنشاء gu)‏ بياني للاحتمال المتوقع للحصول على الإجابة الثانية 
للمتغير warmice‏ تكون "عو دة الجليد" “recovered”‏ نقوم بتكرار الأمر 
margins‏ ولكن مع الخيار ‘predict(outcome(2))‏ الشكل (10.9) يعرض 
النتائج. 


smargins, at(party = (1 2 3) warmop2 - (1 0)) 
vsquish predict (outcome (2)) 
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آذآ ل ل ا ت 


Predictive margins Number of obs = 486 
Model VCE : Linearized 
Expression : Pr(warmice==Recovered), predict (outcome (2) ) 
Te. tate : party = 1 
warmop2 = 1 
2. iat : party = 1 
warmop2 = 0 
SRE : party = 2 
warmop2 = 1 
4. at : party z 2 
warmop2 = 0 
Sat : party = 3 
5 warmop2 = 1 
6._at : party = 3 
warmop2 = 0 











Delta-method 
Margin Std. Err. 2 P>|z| [95$ Conf. Interval] 





1 .0290269 .0112526 2.58 0.010 .0069723 .0510815 
2 .1023611 .0404401 2.53 0.011 0231001 .1816222 
3 .0470891 .0156777 3.00 0.003 .0163614 .0778168 
4 .1507864 .0329816 4.57 0.000 .0861437 .2154292 
5 .0743527 .0306377 2.43 0.015 .014304 .1344015 
6 .2091542 .0372832 5.61 0.000 .1360805 .282228 





.marginsplot 


Predictive Margins with level(95)% Cls 
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الشكل )11.9( هو عبارة عن نسخة مطوّرة من الشكل )9.9( وهو 
يوضح استخدام بعض خيارات الأمر «marginsplot‏ ونبدأ بالخيار quietly‏ 
ونكرر استخدام الأمر margins‏ للإجابة 1 (مناطق أقل) ثم نقوم بطباعة 
الأمر marginsplot‏ مع خيارات أخرى للتحكم في تفاصيل التوصيفات بالرسم 
ومربع الشرح والخطوطء تم توسيع قياسات المحور الأفقي من 1 إلى 3.1 
Fas‏ من الوضع الافتراضي وهو من 1 إلى 3 وذلك حتى نستطيع وضع 
التوصيف "جمهوري" “Republican”‏ داخل الرسم البياني بالأسفل جهة mn‏ 


-quietly margins, at(party = (1 2 3) warmop2 = 
(1 0)) predict (outcome (1) ) 

emarginsplot, legend (position(7) ring (0) 
rows (1) 

title("Believe humans" "changing climate?", 
size (medsmal1) ) ) 

xscale(range(1 3.1)) ytitle("Probability") 





plotiopts(lpattern(dash) lwidth (medthick) 
msymbol (0) ) 
plot2opts (lpattern(solid) lwidth (medthick) 
msymbol (Sh) ) 


title("Predicted probability of ‘Artic ice 
area less' 
response") 


Predicted probability of ‘Artic ice area less’ response 







Probability 
7 


& 


Believe humans 
changing climate? 
—-@-- No —— Yes 


p 
Democrat Independent Republican 
Political DR identification 
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oniy lell isl أطفقوده — مثال‎ ral) sibl الإسناد‎ 


Multiple Imputation of Missing Values — Logit Regression Example 


الفصل )8( عرض طرق الإسناد المتعدد للقيم المفقودة» مستخدماً مقالاً 
عن الانحدار» طرق الإسناد المتعدد تعمل مع الأنواع الأخرى من الانحدار 
Ly‏ فيها الانحدار اللوغاريتمي الذي تم شرحه في هذا الفصل» ولتوضيح ذلك 
سوف نعود لاستخدام بيانات استطلاع جرانيت» ومؤشر الاعتقاد بوجود 
التغير المناخي cwarmop2‏ الجزء السابق اختبر العمر والجنس ومستوى 
التعليم والانتماء السياسي كمتغيرات تنبؤية محتملة للإجابة عن سوال المعرفة 
بالمناخ warmice‏ هذه الخصائص الأربع عادة يُعتقد بأن لها علاقة في 
البحوث المتعلقة بالتأثيرات الاجتماعية للمشاكل البيئية» لذلك فمن المعقول 
الاعتقاد بأن أحدها أو أكثر سوف تكون لها علاقة بالمتغير warmop2‏ وهل 
يُفترض أن نأخذ في الاعتبار daa‏ رب الأسرة والخصائص المهمة الأخرى 
كمتغير تنبؤي محتمل؟ إحدى المشاكل المتعلقة بدخل رب الأسرة في 
استطلاع جرانيت هي أنها تحتوي على عدد كبير من القيم المفقودة: CN‏ 
الكثير من المشاركين لا يميلون للإجابة عن هذا السؤال. 

عشر متغيرات من ملف البيانات Granite2011_06.dta‏ سوف يتم 
استخدامها في هذا التحليل» أرب بعة (employ, ownrent, married, yrslive) lia‏ 
S‏ ليست لها أهمية عند الحديث عن الاعتقاد بوجود التغير المناخي› 
ولكنها ربما تسأعد في إسناد القيم المفقودة لمتغير دخل رب الأسرة income‏ 


.use C:\data\Granite2011_6.dta, clear 
.describe warmop2 age sex educ party income 
employ ownrent married yrslive 








storage display value 
variable name type format label variable label 
warmop2 byte $9.0g yesno Believe happening now/human 
age byte $9.0g age Age of respondent 
sex byte $9.09 sex2 Gender 
educ byte 514.096 educ Highest degree completed 
party byte $11.0g party Political party identification 
income byte $9.0g income3 Household income 2009 
employ byte $13.0g employ Employment status 
ownrent byte %13.0g ownrent Own or rent home 
married byte $9.0g yesno Respondent married 


yrslive byte %8.0g yrslive Years lived in NH 
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-misstable summarize warmop2 age sex educ party 
income employ ownrent married yrslive 


Obs«. 

















Unique 


Variable values 





age 
educ 
party 
income 
employ 
ownrent 
yrslive 


»4 س - ص BN‏ 
مو ثم مو موه قر 
ھ س - 0 رک 


بالرغم من ننا قمنا بإدراج المتغيرات warmop2, sex, married‏ ضمن 
الأمر misstable‏ فإن ستاتا كشف أن هذه المتغيرات لا تحتوي على قيم 
cba giia‏ ولم يتم عرضها ضمن المخرجات. ومن ناحية أخرىء؛ فإنه لدينا 
1 قيمة مفقودة من أصل 516 قيمة بمتغير income‏ وإذا قمنا بحساب 
انحدار المتغير الثنائي warmop2‏ على المتغير income‏ مع المتغيرات التي 
يمكن أن يكون لها علاقة» فإن التقديرات تتضمن 340 مشاهدة فقط. 

-Svy: logit warmop2 age sex educ party income 


(running logit on estimation sample) 


Survey: Logistic regression 


Number of strata  - 1 Number of obs z 340 
Number of PSUS z 340 Population size - 336.84437 
Design df = 339 
FG ¥ 335) = 13.47 
Prob > F = 0.0000 

















Linearized 


warmop2 Coef. Std. Err. E P>|t| [95% Conf. Interval 





age -.014292 .0092398 “95 10:123 -.0324666 .0038826 
sex - 4762698 + 2829395 1.68 0.093 -.0802685 1.032808 
educ -2508435 .1525283 1.64 0.101 -.0491775 .5508646 
party -1.176907 .1547857 -7.60 0.000 -1.481369 -.8724461 
income .0366035 .0768294 0.48 0.634 -.114519 .1877259 
—cons 2.252896 7718417 2.90 0.004 .7228924 3.7829 
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المتغير الوحيد الذي له تأثير ذو المعنوية الإحصائية هو الانتماء 
السياسي. هل سوف نحصل على نفس النتيجة إذا ما قمنا بإجراء هذا التحليل 
من جديد بدون استبعاد أي بيانات جانبا؟ الإسناد المتعدد يُعتبر وسيلة للإجابة 
على هذا السؤال. 


نقوم بأول خطوة في عملية الإسناد وهي استبعاد 42 مشاهدة لها قيم 
مفقودة في أي من المتغيرات ذات العلاقة باستثناء متغير cincome‏ وبعد القيام 
بذلك» سوف تكون لدينا بيانات تحتوي على 516 — 42 = 474 مشاهدة 
تتضمن 137 مشأهدة هي عبارة عن قيم مفقودة خاصة بالمتغير -income‏ 


.keep if !missing(warmop2, age, sex, educ, 
party, employ,ownrent, married, yrslive) 
(42o0bservations deleted) 

.misstable summarize warmop2 age sex educ party 
income employ ownrent married yrslive 


Obs«. 












Unique 
values 





Variable Obs». 





income 


في الخطوة التالية» سوف نقوم بتحديد تنسيق لبيانات الإسناد المتعدد 

باستخدام mlog JUAN)‏ وهو اختيار لكفاءة الذاكرة. المتغير income‏ سوف يتم 

تسجيله باستخدام الخيار imputed‏ وهذا يعني Ud‏ سوف نحاول أن نقوم 

بتعويض القيم المفقودة للمتغير LÍ cincome‏ المتغيرات الأخرى فسوف يتم 
تسجيلها كمتغيرات عادية regular‏ ولن يتم إسنادها. 

-mi set mlong 

.mi register imputed income 

(137m=0 obs. now marked as incomplete) 


.mi register regular warmop2 sex educ party 
employ ownrent married yrslive 


7 مشاهدة قيمها مفقودة بالمتغير income‏ والتي تم توقعها باس تخدام 
الانحدار مع المتغيرات cemploy, ownrent, married, yrslive‏ تم إنشاء 50 قيمة 


الفصل التاسع : laa!‏ اللوغاريتمي 447 
aaa‏ ال ON‏ ا ل ل ف لت 
إسناد لكل القيم المتوقعة 137 زائداً Gus‏ عشوائياًء عمليات الإسناد هذه تم 
تجميعها لتقدير نموذج انحدار لوغاريتمي جديد. 


.mi impute regress incomeemploy ownrent married 
yrslive, add(50) rseed(12345) 


Univariate imputation Imputations = 50 
Linear regression added = 50 
Imputed: z1 through 750 updated = 0 






Observations per m 





Variable Complete Incomplete Imputed Total 
















income 337 





137 137 474 


(complete + incomplete - total; imputed is the minimum across m 
of the number of filled-in observations.) 


-mi estimate: svy: logit warmop2 age sex educ 
party income 


Multiple-imputation estimates Imputations = 50 

Survey: Logistic regression Number of obs = 474 

Number of strata = al Population size = 472.04182 
Number of PSUs = 474 

Average RVI = 0.0298 

Largest FMI = 0.1511 

Complete DF = 473 

DF adjustment: Small sample DF: min = 338.55 

avg = 443.42 

max - 470.18 

Model F test: Equal FMI F( 5, 469.8) z 16.88 

Within VCE type: Linearized Prob» F = 0.0000 



















warmop2 Coef. 


Std. Err. t P»|t| [95$ Conf. Interval] 





age -.0188856 .0075324 -2.51 0.013 -.033687 -.0040842 
sex .4338802 + 2372722 1.83 0.068 -.0323649 . 9001254 
educ .2489546 .1262441 1.97 0.049 .0008665 .4970427 
party -1.154414 .1318129 -8.76 0.000 -1.41343 -.8953988 
income -0134369 -0681875 0.20 0.844 -.1206877 .1475614 
_cons 2.669003 . 6581604 4.06 0.000 1.375593 3.962413 
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بعد إجراء عمليات الإسناد المتعدد؛ فإن مُعَامل المتغير party‏ يظل قريباً 
من سابقه (1.15- بالمقارنة مع السابق وهو 1.18-) ولايزال تأثيره ذا 
معنوية إحصائية. النتائج الأخرى تظهر تغيرا أكبرء وهذا التغير يتضمن 
تغيراً في المُعَاملات ولكن بصفة عامة تتشابه مع الأخطاء المعيارية مما 
يعكس أن التقديرات أصبحت ASÍ‏ دقة بعد إجراء عمليات الإسناد للبيانات» 
من خلال هذه التعديلات فإن coul‏ المتغير Lu) age‏ ب) والمتغير educ‏ 
(موجب) الآن أصبحت ذات معنوية إحصائية» وهذا يشبه النشائج التي 
أظهرتها دراسات سابقة حول الاعتقاد بوجود التغير المناخي. ومن ناحية 
«cs sj‏ فإن المتغير income‏ يبدو أقل تأثيراً قبل وبعد إجراء عملية الإسناد. 
هذه النتيجة تدعم وجهة النظر التي تقترح استبعاد متغير income‏ من النموذج 
النهائي» والتركيز على المتغيرات التنبؤية الأكثر أهمية والأقل إشكالاً. 


goa)‏ العام 
نماذج عد الأحداث والبقاء 


Survival and Event-Count Models 


———— MÀ————— M 
هذا الفصلء نماذج لتحليل بيانات الحدث وتحليل البقاء. تحليل‎ Ty 
البقاء يتضمن عدة تقنيات ذات صلة تركز على أزمنة وقوع الحدث» وبالرغم‎ 
من أن الحدث يمكن أن يكون حسناً أو سيئاء « فإننا سوف نتفق على أن نشير‎ 
إلى أن الحدث باسم "الفشل". والوقت اللازم للفشل يسمى 'زمن البقاء". تحليل‎ 
البقاء مهم جداً في البحوث الطبية الحيويةء ولكن يمكن تطبيقه بشكل متساو‎ 
على الحقول العلمية الأخرى من الهندسة إلى العلوم الاجتماعية. فمثلا عند‎ 
صياغة نموذج للزمن اللازم للشخص العاطل عن العمل للحصول على‎ 
وظيفة» أو الشخص العازب حتى يتزوج» فإن برنامج ستاتا يوفر عدذا كبيرًا‎ 
من طرق تحليل البقاء. وهذا الفصل سوف يشرح جزءًا بسيطا منها.‎ 


وسوف نلقي نظرة سريعة على انحدار بواسون ومكوناته. هذه الطرق 
لا تركز lu‏ على أزمنة البقاء» ولكن تركز Laj‏ على معدلات أو أعداد 
الأحداث خلال فاصل زمني محدد. طرق عد الأحداث تتضمن انحدار 
بواسون» والانحدار الثنائي السالب. مثل هذه النماذج يمكن صياغتها باستخدام 
أوامر محددة أو باستخدام المدخل الأكثر Y gai‏ وهو النموذج الخطي العام 
-generalized linear modeling (GLM)‏ 





Survival Analysis and Epidemiological دليل المستخدم‎ cle يرجى الاطلاع‎ 

Tables Reference Manual‏ للحصول على مزيد من المعلومات عن إمكانات 
برنامج ستاتا. أو قم بطباعة الأمر help st‏ للاطلاع على نظرة عامة على 
شبكة الإنترنت عن هذا التحليل. كما أن دراسة Selvin‏ )2004( تقوم بتوضيح 
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تحليل البقاء وانحدار بواسون. وقد قام مؤلف هذا الكتاب باستعارة (بعد 
الحصول على إذن بذلك) بعض الأمثلة من دراسة Selvin‏ الشرح المفيد الآخر 
عن تحليل البقاء يمكن الحصول عليه من كتاب خاص عن برنامج ستاتا 
تم إعداده من قبل et al.‏ 7716765 )2010( وهناك فصل تم إعداده من قبل 
Rosner‏ )1995( كما تم إعداد شرح متكامل من قبل Hosmer, Lemeshow and‏ 
Lee 5 (2008) May‏ )1992(« وتم شرح النماذج الخطية العامة من قبل 
McCullagh and Nelder‏ )1989(« وفي كتاب Long‏ )1997( هناك فصل حول 
نماذج الانحدار لعد البيانات (يشمل بواسون وذا الحدين السالب) وأيضا بعض 
الأمثلة عن النماذج الخطية العامة. ويمكن الحصول على شرح مفصل عن 
النماذج الخطية العامة في كتاب Hardin and Hilbe‏ (2012). 
مجموعات قوائم ستاتا التي لها علاقة بهذا الفصل تتضمن: 
Statistics < Survival analysis‏ 
Graphics » Survival analysis graphs‏ 
Statistics > Count outcomes‏ 
Statistics > Generalized linear models‏ 
وتجدر الإشارة ob‏ الجداول الوبائية لم يتم تناولها في هذا الفصلء 
وللحصول على معلومات عنها قم بطباعة الأمر help  epitab‏ أو قم بالاطلاع 
على قو e‏ ستاتا: 
Statistics < Epidemiology and related‏ 
أمثلة عن الأوامر : Example Commands‏ 





cael‏ أوامر تحليل البقاء ببرنامج ستاتا (st)‏ تتطلب أن تكون البيانات قد 

تم تحديدها مسبقاً كزمن بقاء باستخدام الأمر estset‏ ويجب استخدام الأمر 
stset‏ مرة cbadal y‏ وبعد ذلك سوف يتم حفظ البيانات. 

.Stset timevar, failure(failvar) 

يقوم بتحديد سجل مفرد ليمثل بيانات زمن بقاء المتغير timevar‏ يشير 

إلى الزمن الذي مضى قبل وقوع حدث معين (يسمى "الفشل") أو الفترة التي 

أنتهت فيها المشاهدة ("المراقبة"). أما المتغير fallar‏ يشير إلى ما إذا كان 
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الفشل )1 = (failvar‏ 3 المراقبة )0 = (failvar‏ عند الزمن مء . البيانات 
TEC‏ فقط على سجل واحد لكل «Cus‏ ويجب تحديدها باستخدام الأمر stset‏ 
قبل استخدام أوامر stt‏ في أي حسابات. وإذا قمنا بحفظ البيانات» فإن 
تحديدات الأمر stset‏ سوف يتم fee J lehia‏ الأمر stset‏ يقوم بإنشاء 
متغيرات جديدة اسمها 10 st, d, f‏ وهي عبارة عن ترهيز للمعلومات 
اللازمة لاستخدام أي od‏ من أوامر st®‏ 

.Stset  timevar,  failure(failvar)  id(patient) 

enter(time start) 


يقوم بتحديد بيانات أزمنة البقاء لسجلات متعددةء وفي هذا «Qai‏ فإن 
المتغير rimevar‏ يشير إلى الوقت الذي مضى قبل حدوث الفشل أو المراقبة. 
المتغير failvar‏ يشير إلى ما إذا كان الفشل (1) أو المراقبة )0( Chas‏ عند 
هذا الوقت. المتغير patient‏ عبارة عن رقم محدد. نفس الحالة يمكن أن 
تساهم في ASÍ‏ من سجل واحد في البيانات» ولكنها دائما لها نفس الرقم 
المحدد. المتغير start‏ يقوم بتسجيل زمن مراقبة كل مشاهدة. 
.Stdescribe‏ 
يشرح بيانات زمن البقاء» ويضع قائمة بالتعريفات والخصائص الأخرى 
للبيانات التي قام بإنشائها الأمر .stset‏ 
.stsum‏ 
يقوم بإنشاء إحصائيات مختصرة تتضمن: الوقت الكلي عند الخطرء 
معدل الوقوع» arc‏ المجموعات» ونسب أزمنة البقاء. 
.ctset time nfail ncensor nenter, by(ethnic sex)‏ 
يحدد بيانات أزمنة العد. وفي هذا المثال» فإن المتغير Jue time‏ $ عن 
مقياس للوقت. والمتغير nfail‏ يمثل aae‏ مرات الفشل التي حدثت عند الزمن 
cime‏ ويمكننا إضافة متغيرات أخرى She‏ المتغير aae) ncensor‏ المشاهدات 
التي تمت مراقبتها عند الزمن (time‏ والمتغير menter‏ (عدد المدخلات عند 
الزمن (rime‏ وتجدر الإشارة إلى أن إضافة هذه المتغيرات اختيارية» كما أن 
المتغير ethnic‏ والمتغير sex‏ هما متغيران تصنيفيان آخران يُعرفان 
المشاهدات في هذه البيانات. 
.cttost‏ 


452 الإحصاء مع برنامج ستاتا 


يقوم بتحويل بيانات أزمنة العد - والتي تم تحديدها مسبقاً باستخدام 
الأمر etset‏ - بحيث تكون في شكل أزمنة بقاء يمكن تحليلها باس تخدام 
مجموعة أوامر *ء. 
¿sts graph‏ 
يقوم بإنشاء رسم بياني لدالة ela‏ كابلان ميير «Kaplan-Meier‏ ولمقارنة 
اثنتين أو أكثر من دوال البقاء - مثل مقارنة قيمة واحدة في كل متغير تصنيفي 
sex‏ - نقوم باستخدام الخيار 0رطاء وتكون تركيبة الأمر على شكل sts graph,‏ 
by(sex)‏ وللتخيل plaid)‏ لنطار كوكين على قارات iaa ye‏ مستعر Qi‏ 
متغير cage jall‏ نقوم باستخدام الخيار «adjustfor()‏ وتكون تركيبة الأمر 
على .sts graph, by (sex) adjustfor(age) J‏ فالخيارات adjustfor() 5 by()‏ 
تعمل بنفس الطريقة مع الأمر sts list‏ والأمر .sts generate‏ 
¿sts list‏ 
يقوم بإنشاء قائمة تحتوي على Alla‏ بقاء كابلان ميير المقذرة. 
.Sts test sex‏ 
يقوم باختبار التساوي بين دوال بقاء كابلان ميير في فئات المتغير sex‏ 
.Sts generate survfunc = S‏ 
يقوم بإنشاء متغير جديد تتم تسميته عشوائياً باسم survfune‏ يحتوي على 
Alla‏ بقاء كابلان ميير المقدرة. 
.Stcox x1 x2 x3‏ 
يقوم هذا الأمر بصياغة نموذج المخاطرة النسبي لكوكسء وانحدار 
الزمن إلى الفشل على المتغيرات التنبؤية الوهمية أو المستمرة 1× X3, x2,‏ 


.Stcox x1 x2 x3, strata(x4) vce(robust) 
.predict hazard, basechazard 


يقوم هذا الأمر بصياغة نموذج المخاطرة النسبي لكوكس مقستمة إلى 
طبقات باستخدام المتغير .x4‏ الخيار vee(robust)‏ يتطلب تقدير Lhal‏ 
المعياري الموثوق» انظر الفصل (8) أو دليل المستخدم User's Guide‏ 
للحصول على شرح كامل للأخطاء المعيارية الموثوقة. الأمر predict‏ يقوم 
بحفظ دالة المخاطرة التراكمية الأساسية لمجموعة محددة؛ ويتم حفظها 
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كمتغير جديد باسم hazard‏ للحصول على خيارات أكثر قم بطباعة help‏ 
postestimation‏ 51207 
.Stphplot, by(sex)‏ 
يقوم بإنشاء رسم بياني ل In(-In(survival))‏ - مقايل In(analysis time)‏ 
لكل مستوى للمتغير النوعي sex‏ من نموذج steox‏ السابق» Go‏ المنحنيات 
المتوازية تدعم فرضية نموذج كوكس التي تقو تقول بأن نسبة المخاطرة لا تتغير 
مع cd i‏ ولإجراء Iced aia‏ کیا Lai ft Al gioco‏ 
باستخدام الأمر steoxkm‏ (يقارن منحنيات كوكس المتوقعة مع منحنيات البقاء 
المشاهدة لكابلان وميير) والأمر estat phtest‏ (يقوم بالاختبار e Uo‏ على بواقي 
شونفيلد (Schoenfeld residuals‏ لمعرفة المزيد عن خيارات وتركيية هذه 
الأوامر قم بطباعة -help stcox diagnostics‏ 
.Streg x1 x2, dist (weibull)‏ 
يقوم بصياغة نموذج توزيع ويبل Weibull-distribution‏ لانحدار نسبة 
الوقت إلى الفشل على متغير تنبؤي وهمي أو مستمر 1× و2×. 


.Streg x1 x2 x3 x4, dist(exponential) 
vce(robust) 


يقوم بصياغة نموذج التوزيع الأمتي لانحدار الوقت إلى الفشل على 
متغيرات تنبو بؤية وهمية أو مستمرة ex4, x3, x2, xl‏ كما يقوم بحساب تقديرات 
الخطأ المعياري لاختلاف التباين الموثوق sheteroskedasticity-robust‏ 
بالإضافة إلى توزيع ويبل» والتوزيع الأسّي والتوزيعات الأخرى dist) U‏ 
ومحددات الأمر streg‏ بما فيها اللوغاريتم الطبيعي واللوغاريتم المنطقي 
وتوزيعات جاما المعيارية وتوزيعات جومبرتز Gompertz‏ وللحصول على 
مزيد من التفاصيل عن هذا الأمر وخياراته قم بطباعة الأمر help streg‏ 
.Stcurve, survival‏ 
بعد استخدام الأمر estreg‏ فإن الأمر أعلاه يقوم بإنشاء رسم بياني لدالة . 
البقاء لنتائج النموذج الذي تم حسابه بالأمر streg‏ للقيم المتوسطة لكل 
x Cal yia‏ 
.Stcurve, cumhaz at(x3-50, x4=0)‏ 
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بعد استخدام الأمر estreg‏ فإن الأمر أعلاه يقوم بإنشاء رسم بياني لدالة 
المخاطرة التراكمية لنتائج النموذج الذي تم حسابه بالأمر streg‏ للقيم المتوسطة 
للمتغيرات x3, x23]‏ عند القيمة 50 LÍ‏ المتغير 4× فيكون عند القيمة 0 
.poisson count x1 x2 x3, irr exposure(x4)‏ 
يقوم بحساب انحدار بواسون لمتغير الأحداث المعدودة count‏ (مفترضاً 
أنها تتبع توزيع بواسون) على المتغيرات المستقلة الوهمية أو المستمرة 
xl‏ ,2× ,3× » وسوف يتم عرض تأثيرات المتغيرات SS a‏ 
الوقوع (rr)‏ أما الخيار exposure()‏ فهو يقوم بتحديد متغير يشير إلى كمية 
العرض في حالة عدم تساوي الفرض الصيع FeAl‏ ويج هة أن 
أي نموذج بواسون يفترض أن احتمالية الحدث تبقى ثابتة بغض النظر عن 
عدد مرات وقوع الحدث في كل مشاهدة. وإذا لم تبق الاحتمالية ثابتة» فإننا 
Ya‏ من ذلك يجب أن نأخذ في الاعتبار استخدام الأمر nbreg‏ (انحدار ذو 
حدين سالب) والأمر 5 (انحدار ذو حدين سالب معياري). 
.glm count x1 x2 x3, link(log) family (poisson)‏ 
exposure(x4) eform‏ 
يقوم بحساب الانحدار بنفس الطريقة المشار إليها في Jid‏ أعلاه 
OS s «poisson‏ كنموذج خطي معياري (GLM)‏ الأمر gim‏ يفك أن يتناسب 
مع نموذج بواسون وذي الحدين السالب واللوغاريتمي والعديد من أنواع 
النماذج الأخرى» وهذا يعتمد على ما هي الخيارات linko‏ (رابط الدالة) 
familyQ s‏ (مجموعة التوزيع) التي تُستخد 


بيانات أزمنة البقا؟ : Survival-Time Data‏ 

بيانات أزمنة البقاء تتضمن متغيرا واحدًا على الأقل؛ وهذا المتغير يقوم 
بقياس كم يمضي من الوقت قبل وقوع حدث معين في كل مشاهدة. المراجع 
الإحصائية في العادة تقوم بتسمية هذا الحدث 'فشل" بغض النظر عن المعنى 
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الحقيقي لهذه الكلمة» عند عدم وقوع الفشل في مشاهدة ما في بيانات أزمنة 
البقاء بنهاية عملية جمع هذه البيانات» فإن المشاهدة يجب أن يقال عنها 
'مُراقبة". الأمر stset‏ يحدد البيانات التي سوف يتم اس تخدامها في تحليل 
أزمنة البقاء» وذلك من خلال تحديد المتغير الذي يقوم بقياس الزمن (وإذا 
كان ضرورياً) تحديد المتغير الثنائي (1 ,0) كمؤشر لمعرفة ما إذا كانت 
المشاهدة 'فشل" أو 'مراقبة". البيانات يمكن أن تحتوي على أي رقم لمقياس 
آخر أو متغيرات نوعية» والأفراد (مثلاً المرضى في المستشفيات) يمكن 
تمثيلهم بواسطة أكثر من مشاهدة. 
ولشرح استخدام الأمر stset‏ سوف fais‏ بمثال من دراسة Selvin‏ 

(1995:453) التي تحتوي على بيانات 51 شخصاً تم تشخيصهم على أنهم 
مصابون بمرض نقص المناعة HIV‏ البيانات توجد في الملف aids.raw‏ 
وتظهر البيانات كما يلي: 

1 i 1 34 

2 A? 1 42 

3 37 0 47 


(rows 4-50 omitted) 
54 81 0 29 


قيم العمود الأول (من الجهة اليسرى) تظهر axe‏ الحالات )1 2: 3: 
... 51). العمود الثاني يوضح كم شهرًا مضى بعد التشخيص وقبل أن تظهر 
على الشخص أعراض مرض AIDS‏ أو نهاية الدراسة )61 617 37 ...)» 
العمود الثالث يحتوي على 1 إذا كان الشخص ظهرت عليه أعراض مرض 
AIDS‏ (الفشل) أو 0 إذا لم تظهر الأعراض في فترة نهاية الدراسة (مراقبة)» 
العمود الأخير يوضح أعمار الأشخاص عند وقت التشخيص. 

يمكننا قراءة البيانات الخام في الذاكرة باستخدام الأمر cinfile‏ ثم نقوم 
بوصف المتغيرات والبيانات: 


.infile case time aids age using 
C:\data\aids.raw, clear 
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.label variable case "Case ID number' 

.label variable time "Months since HIV diagnosis' 
.label variahle aids "Developed AIDS symptoms' 
.label variable age "Age in years' 

.label data "AIDS (Selvin 1995:453)' 

.Compress 


لخطوة التالية هي تحديد المتغير الذي يقوم بقياس الزمن» والذي يشير 
إلى الفشل أو المراقبة. وبالرغم من أنه ليس من الضروري مع هذا النوع من 
البيانات تحديد رقم مميز لكل حالةء فإننا سوف نقوم بذلك. الأمر stset‏ يحدد 
المتغير الذي يقوم بقياس الزمن» وبالتالي سوف aas‏ الفشل failure()‏ كممثل 
وهمي يُحدد ما إذا كانت المشاهدة فشل (1) أو مراقبة (0)» وبعد اس تخدام 
الأمر stset‏ سوف نقوم بحفظ البيانات في ملف بتنسيق ستاتا للحفاظ على هذه 


البيانات. 
.Stset time, failure(aids) id(case)‏ 
id: case‏ 
failure event: aids !- 0 & aids > .‏ 
obs. time interval: (time[ n-1], time]‏ 
exit on or before: failure‏ 
total obs.‏ 51 
exclusions‏ 0 
obs. remaining, representing‏ 51 
subjects‏ 51 
failures in single failure-per-subject data‏ 25 
total analysis time at risk, at risk from t - 0‏ 3164 
earliest observed entry t - 0‏ 
last observed exit t - 97‏ 


.save aids.dta, replace 

Stdescribe‏ يعرض sadi‏ مختصرًا لكيفية تركيب بيانات أزمنة البقاء. 

لدينا في هذا المثال البسيط سجل واحد فقط لكل شخصء ولذلك فإن oaa‏ 
هده المعلومات غير ضرورية. 

.Stdescribe 
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—————————————————————————————— 


failure d: aids 
analysis time t: time 





id: case 
per subject 

Category total mean min median max 
SSS 
no. of subjects 51 
no. of records 51 1 1 4 1 
(first) entry time 0 0 
(final) exit time 62.03922 1 67 97 
subjects with gap 0 
time on gap if gap 0 7 2 9 . 
time at risk 3164 62.03922 1 67 97 
failures 25 .4901961 0 0 1 





الأمر stsum‏ يقوم بحساب إحصائيات مختصرة» حيث ينضح أنه لدينا 
25 فشلاً من 3,164 شخص/ شهرء وهذا يعني أن معدل الحدوث هو 25 + 
3164 = 0.0079014 » أما نسب زمن البقاء فسوف يتم اشتقاقها من دالة 
البقاء لكابلان- ميير (الجزء التالي من هذا الفصل). الدالة تقوم بتقدير نحو 
5 فرصة للإصابة بمرض AIDS‏ خلال فترة 41 شهرًا بعد التشخيص» 
;9650 خلال فترة 81 شهراء خلال الفترة التي تغطيها البيانات (نحو 97 
(I‏ احتمالية الإصابة بمرض AIDS‏ لم تصل لنسبة %75 ولذا ليست 
هناك نسبة ترتيبها 75. 
.Stsum‏ 


failure d: aids 
analysis time t: time 
id: case 


incidence no. of سم‎ Survival time 
time at risk rate subjects 25% 50% 75% 





total 3164 - 0079014 51 41 81 


إذا احتوت البيانات على متغير نوعي أو متغير تجميعي مثل الجنس» 
فإنه يمكننا الحصول على إحصائيات مختصرة لزمن البقاء بشكل منفصل 
لكل مجموعة بواسطة الأمر التالي: 

.Stsum, by(sex) 


458 الإحصاء مع برنامج ستاتا 


الجزء التالي يشرح طرقاً أكثر منهجية للمقارنة بين أزمنة البقاء 
لمجموعتين أو أكثر. 
بيانات حساب الْزمن : Count-Time Data‏ 


I 


بيانات زمن البقاء (st)‏ بالملف 6 تحتوي على Cilio sles‏ عن 
حالات فردية (أشخاص أو أشياء) مع متغيرات تشير إلى زمن وقوع الفشل 
أو المراقبة لكل حالة فرديةء هناك نوع آخر مختلف من البيانات يسمى 
'حساب الزمن" تحتوي على بيانات إجمالية مع متغيرات تقوم بتعداد الحالات 
الفردية للفشل أو المراقبة عند الزمن :. فعلى سبيل call‏ ملف البيانات 
diskdriv.dta‏ يحتوي على معلومات عن اختبار افتراضي ل 25 قرصاً 
صلباًء كل الأقراص باستثناء 5 فقط فشلت قبل Ade‏ الاختبار عند زمن 


1,200 ساعة. 
.use C:\data\diskdriv.dta, clear‏ 
.describe‏ 
Contains data from C:\data\diskdriv.dta‏ 
obs: 6 Count-time data on disk drives‏ 
vars: 3 1 Jul 2012 18:13‏ 
size: 24‏ 
 ——‏ سس 
storage display value‏ 
variable name type format label variable label‏ 
na‏ 
hours int $8.0g Hours of continuous operation‏ 
failures byte $8.0g Number of failures observed‏ 
censored byte $9.0g Number still working‏ 
لصطصلصليي + ل ب يي سحب[ رسيا 
Sorted by:‏ 
.list‏ 


hours failures censored 


ON OP‏ س م ي 
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لتحديد بيانات على أنها بيانات حساب الزمنء يجب علينا تحديد متغير 
الوقت» ومتغير لعدد مرات الفشل» ومتغير لعدد مرات المراقبة على التوالي. 
فبعد استخدام الأمر ctest‏ يقوم cttost Yl‏ تلقاتياً بتحويل بيانات حساب 

الزمن إلى تنسيق زمن البقاء. 
.ctset hours failures censored‏ 


dataset name: C:\data\diskdriv.dta 
time: hours 
no. fail: failures 
no. lost: censored 


no. enter: -- (meaning all enter at time 0) 
.cttost 

failure event: failures !- 0 & failures « . 
obs. time interval: (0, hours] 


exit on or before: failure 
weight:  [fweight-w] 


nn 


6 total obs. 
0 exclusions 
سم‎ a 
6 physical obs. remaining, equal to 
25 weighted obs., representing 
20 failures in single record/single failure data 


19400 total analysis time at risk, at risk from t = 0 
earliest observed entry t - 0 
last observed exit t - 1200 

.list 


hours failures censored w 


ub س‎ ON OH 





.Stdescribe 
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للل 


failure _d: failures 


analysis time _t: hours 
weight: [fweight=w] 


per subject 


unweighted unweighted unweighted 

Category total mean min median max 
ج‎ 
no. of subjects 6 

no. of records 6 1 1 x 1 
(first) entry time 0 0 0 0 
(final) exit time 700 200 700 1200 
subjects with gap 0 

time on gap if gap 0 

time at risk 4200 700 200 700 1200 
failures 5 .8333333 0 1 1 





الأمر ettost‏ يقوم بتحديد مجموعة من الأوزان التكرارية w‏ في البيانات 
المستخرجة ذات تنسيق cst-‏ كما os‏ الأوامر التي fas‏ ب*)و تقوم تلقائياً 
بالتعرف على هذه الأوزان واستخدامها في أي تحليل لزمن ce lal‏ ولذلك فإن 
البيانات التي رأيناها سابقا تحتوي على 25 مشاهدة (25 قرصا صلبا) بدلا 

من الوضع السابق وهو 6 (ست فترات زمنية). 
Stsum‏ . 


failure d: failures 
analysis time t: hours 
weight: [fweight=w] 


incidence no. of م‎ Survival time 
time at risk rate subjects 258 50% 75% 





total 19400 + 0010309 25 600 800 1000 


Kaplan-Meier Survivor Functions : yun ~ Ol sly dlos 


بافتراض أن « تمثل axe‏ المشاهدات التي لا يوجد بها فشل أو مراقبة 
عند بداية الفترة الزمنية dg cf‏ تمثل عدد مرات الفشل التي حدثت لتلك 
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المشاهدات خلال الفترة fa Aga jl‏ كابلان - ميير للبقاء بعد الفترة » هو 
ناتج احتمالات البقاء عند الزمن + والفترات السابقة: 





Ly 


5()- II {(n; - =n} [10.1] 


فمثلاً في بيانات مرض نقص المناعة AIDS‏ التي رأيناها سابقاًء فإن 
شخصاً واحدًا من 51 شخصاً ظهرت عليه الأعراض بعد شهر واحد فقط من 
التشخيص» ولم تكن هناك مشاهدات مراقبة عند هذه الفترة المبكرةء ولذلك 
فإن احتمالية "البقاء" (أي عدم ظهور أعراض (AIDS‏ بعد الفترة 1 - time‏ هو 
S(I) = (51 — 1)/51 = 0.9804‏ 
مريض ثان ظهرت عليه الأعراض عند dime = 2 $ fill‏ ومريض ثالث 
عند الفترة 9 = time‏ : 
S(2) = 0.9804 x (51 -1(/ 51 = 0.9608‏ 
S(9) = 0.9608 x (51 -1(/ 51 = 0.9412‏ 
aie y‏ إنشاء رسم بياني للمرضى SY)‏ مع الزمن + » فإن منحنى البقاء 
لكابلان - ميير يظهر كما في الشكل (1.10). برنامج ستاتا يقوم برسم مثل 
هذه الأشكال البيانية بشكل تلقائي باستخدام الأمر sts graph‏ فمثلا: 


euse C:\data\aids, clear 








.Sts graph 
" Kaplan-Meier survival estimate 
8j 
RJ 
o 
o 
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o 
a4 
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الشكل )1.10( 
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المثال الثاني الخاص بدوال البقاء - سوف نتحول إلى البيانات الموجودة 
بالملف smokingi.dta‏ — والتي 4 تم الحصول عليها من دراسة Rosner‏ عن 
المشاهدات الموجودة بالبيانات عبارة عن 234 مدختاً Gia‏ يحاولون الإقلاع عن 
التدخين خين» أغلب المدخنين لم ينجحوا في الإقلاع عن التدخين odd v‏ برو 
بتسجيل عدد الأيام ما بين الإقلاع عن التدخين والعودة إليه من جديد. وغطت 
الدراسة مدة سنة baal y‏ المتغير X smoking‏ إلى ما إذا كان الشخص قد عاد 
إلى التدخين قبل نهاية مدة الدراسة (smoking = 1 Ja)‏ أو لم يعد للتدخين 
«(smoking = 0 »" Ai] 4)‏ مع البيانات الجديدة يُفترض أن fas‏ باستخدام الأمر 
stset‏ لجعل البيانات جاهزة لتحليل زمن البقاء. 


.use C:\data\smokingl.dta, clear 





.describe 
Contains data from C:\data\smokingl.dta 
obs: 234 Smoking (Rosner 1995:607) 
vars: 8 2 Jul 2012 06:11 
size: 2,808 
storage display value 

variable name type format label variable label 
سسس‎ 
id int %9.09 Case ID number 

days int $9.0g Days abstinent 

smoking byte 59 . 09 Resumed smoking 

age byte $9.0g Age in years 

sex byte %9.0g sex Sex (female) 

cigs byte &9.0g Cigarettes per day 

co int $9.0g Carbon monoxide x 10 
minutes int $9.0g Minutes elapsed since last cig 
sss 
Sorted by: 


.Stset days, failure (smoking) 


failure event: smoking !- 0 & smoking < . 
obs. time interval: (0, days] 
exit on or before: failure 


234 total obs. 
0 exclusions 
NN 
234 obs. remaining, representing 
201 failures in single record/single failure data 
18946 total analysis time at risk, at risk from t = 0 
earliest observed entry t - 0 
last observed exit t - 366 
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الدراسة تتضمن 110 Slay‏ و124 امرأة» معدلات الوقوع لكلا الجنسين 
يبدو أنها متشابهة. 





.Stsum, by(sex) 


failure _d: smoking 
analysis time _t: days 







incidence no. of H= Survival time 
time at risk rate subjects 25% 50% 75% 













.0105526 
.0106582 


8813 
10133 













.0106091 


الشكل )2.10( يؤكد هذا التشابه» حيث يُظهر الشكل اختلافاً بسيطاً بين 
دوال البقاء للرجال والنساء؛ حيث عاد كلا الجنسين للتدخين من جديد في 
نفس الوقت تقريباً. احتمالات البقاء للأشخاص غير المدخنين تنخفض بشكل 
كبير خلال فترة ال 30 Leg‏ الأولى بعد الإقلاع عنه؛ لكلا الجنسين هناك 
احتمال أقل من 9615 للبقاء كشخص غير مدخن بعد انقضاء سنة. 


ests graph, by(sex) plotiopt(l1width(medium)) 
plot2opt (lwidth(thick) ) 
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Kaplan-Meier survival estimates 
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يمكننا اختبار التساوي في دوال البقاء باستخدام اختبار لوغاريتم 
الرتب» وليس غريبا أن هذا الاختبار لم يجد أي اختلاف ذا معنوية إحصائية 
(p = 0.6772)‏ للعودة للتدخين بين الرجال والنساء. 


.Sts test sex 
failure d: smoking 
analysis time t: days 


Log-rank test for equality of survivor functions 









Events Events 
observed expected 


Male 
Female 





0.17 
0.6772 


chi2(1) 
Pr»chi2 


Cox Proportional Hazard Models : usos) السبية‎ yos مادج‎ 

نماذج الانحدار تسمح لنا بأن نوسع تحليل البقاءء ونختبر تأثيرات 
المتغيرات التنبؤية الطبقية أو المستمرة المتعددة. إحدى الطرق الأكشر 
lassa‏ تتام بخلك شرت and aula‏ كوكس: Jd oA ca y‏ وة تد 
نموذج مخاطرة نسبياً. ومعدل المخاطرة للفشل عند الزمن + يتم تعريفها بأنها 
معدل الفشل عند الزمن + بين الذين بقوا حتى الزمن + : 

احتمال الفشل بين الوقت + والوقت ۸۲ + 
[2.10] | سسس dft)‏ 
(احتمال الفشل بعد الوقت (Af) (t‏ 

نقوم بصياغة giga‏ لمعدل المخاطرة كدالة لخط الخطر الأساسي (ho)‏ 
عند الوقت + وتأثيرات واحد أو أكثر من متغيرات + : 

A(t) = ho (t) exp(Bixi + Box2 +... + Bux) [210.3] 

وهذا يكافئ 


In[A(?)]- in[Ao (?)] exp(Bixi + Baxa + ... + Bx) [b10.3] 
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"خط الخطر الأساسي" يعني أن الخطر لمشاهدة ما مع كل متغيرات x‏ 
يساوي صفرًا. انحدار كوكس يقوم بتقدير هذا الخط بطريقة لامعلمية»› 
ويحصل على تقدير الأرجحية العظمى ل B‏ لمعلمات المعادلة [10.3]. الأمر 
stcox‏ هو إجراء يقوم بعرض نسب المخاطرة والتي هي عبارة عن تقديرات 
«exp(p)‏ وهي تشير إلى التغيرات النسبية إلى معدل خط الخطر الأساسي. 


هل يؤثر العمر على بداية أعراض مرض نقص المناعة fAIDS‏ ملف 
البيانات aids.dta‏ يتضمن معلومات تناقش هذا السو ال. يجب ملاحظة أن 
الأمر steox‏ يختلف عن أغلب أوامر صياغة نماذج ستاتا - حيث إننا 
سنقوم بإدراج المتغير أو المتغيرات المستقلة فقط» أما المتغيرات التابعة» 
ومتغيرات الوقت» ومتغيرات المراقبة فإن ستاتا يفهمها بشكل تلقائي عند 
استخدام الأمر .stset‏ 


.Stcox age, nolog 


failure d: aids 
analysis time t: time 
id: case 


Cox regression -- Breslow method for ties 


No. of subjects - 51 Number of obs = 51 
No. of failures = 25 
Time at risk = 


LR chi2(1) 5.00 


Log likelihood = -86.576295 Prob » chi2 = 0.0254 









. Ratio 







Std. Err. P>|z| [95$ Conf. Interval] 












1.084557 .0378623 2.33 0.020 1.01283 1.161363 





قد نقوم بتفسير معدل المخاطرة المقتر وهو 1.084557 مع الإشارة إلى 
شخصين مصابين بمرض HIV‏ أعمارهما y a‏ 1+ه» الشخص الأكبر سنا يكون 
أكثر عرضة لظهور أعراض مرض 4195 بنسبة 968.5 خلال فترة أقصر 
(المعدل الخاص بالمخاطر هو 1.084557)» هذا المعدل يختلف اختلافا ذا 
معنوية إحصائية (0.02 = (p‏ عن 1. إذا كنا نريد شرح نتائجنا لفرق خمس 
سنوات في السن» فإننا سوف نتساءل عن معدل المخاطر للأس 5 كما يلي: 
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display exp( b[agel)^5 
1.5005865 
Laie 9650 بنحو‎ lel AIDS ولذلك» فإن خطر بداية الإصابة بمرض‎ 
من ذلك‎ Vang أكير. بخس ستوات مق الشخص, الأؤل»‎ ttl يكون الشخص‎ 
فإنه بالإمكان أن نجد نفس الشيء (ونحصل على فترة ثقة جديدة) بتكرار‎ 
بحيث يتم القياس على أساس 5 سنوات»‎ cage الانحدار بعد تحوير متغيرالعمر‎ 
st- يمنع عرض السجل المتكرر وشرح البيانات‎ nolog noshow الخيار أدناه‎ 


.generate age5 - 5 
.label variable age5 "age in 5-year units' 
.Stcox age5, nolog noshow 


Cox regression -- Breslow method for ties 


No. of subjects - 51 Number of obs = 51 
No. of failures = 25 
Time at risk = 3164 

LR chi2(1) = 5.00 
Log likelihood = -86.576295 Prob > chi2 = 0.0254 








Haz. Ratio Std. Err. 2 P>|z| [95$ Conf. Interval] 





.2619305 1.065815 2.112711 





1.500587 





مشابهاً للانحدار العادي» فإن نماذج كوكس يمكن أن يكون لها أكثر من 
متغير مستقل واحد. وباستخدام ملف البيانات heart.dta‏ الذي يحتوي على 
بيانات gaj‏ بقاء من دراسة Selvin‏ )1995( ل 35 مريضاً لديهم مستويات 
مرتفعة جداً من الكليسترول؛ فإن متغير الزمن»؛ يوضح عدد الأيام لكل 
مرون jid ren‏ و Loud acd‏ 14 قات 
dil X a‏ ك حبك قي igs‏ فر للنتابعة )1 = d (coronary‏ لر قت 
(coronary = 0)‏ البيانات تتضمن Laf‏ مستويات الكليسترول وعوامل أخرى 
يُعتقد gh‏ لها تأترا على مرض القلب» ملف البيانات heart.dta‏ تم إعداده 
لتحليل زمن البقاء عن طرق الأمر cstset time, failure(coronary)‏ ولذلك 
يمكننا أن نقوم باستخدام تحليل st‏ مباشرة. 


الفصل العاشر : نماذج عد الأحداث والبقاء 467 





.describe patient-ab 





storage display value 
variable name type format label variable label 
ڪچ‎ A 
patient byte %9.0g Patient ID number 
time int $9.0g Time in days 
coronary byte %9.0g Coronary event (1) or none (0) 
weight int $9.0g Weight in pounds 
sbp int $9.0g Systolic blood pressure 
chol int $9.0g Cholesterol level 
cigs byte — $9.0g Cigarettes smoked per day 
ab byte %9.0g Type A (1) or B (0) personality 


.Stdescribe 


failure _d: coronary 
analysis time _t: time 


L——— per subject 





Category total mean min median max 
no. of subjects 35 
no. of records 35 1 1 1 I 
(first) entry time 0 0 0 0 
(final) exit time 2580.629 7173 2875 3141 
subjects with gap 0 
time on gap if gap 0 
time at risk 90322 2580.629 773 2875 3141 
failures 8 .2285714 0 0 1 





انحدار كوكس وجد أن مستوى الكليسترول والتدخين Lee‏ يزيدان بشكل 
كبير من مخاطر النوبة القلبية. وبعكس cad shall‏ فإن زيادة الوزن تؤدي إلى 
تخفيض مخاطر النوبة القلبيةء LÍ‏ ضغط pall‏ ونوع الشخصية A/B‏ ليس لهما 
تأثير ذو معنوية إحصائية. 


-Stcox weight sbp chol cigs ab, noshow nolog 
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Cox regression -- no ties 
No. of subjects - 35 Number of obs z 35 
No. of failures - 8 
Time at risk = 90322 
LR chi2(5) = 134.97 
Log likelihood = -17.263231 Prob » chi2 = 0.0158 
_t | Haz. Ratio Std. Err. 2 p»|z| [95$ Conf. Interval] 
weight .9349336 .0305184 -2.06 0.039 .8769919 .9967034 
sbp 1.012947 - 0338061 0.39 0.700 . 9488087 1.081421 
chol 1.032142 .0139984 2.33 0.020 1.005067 1.059947 
cigs 1.203335 .1071031 2.08 0.038 1.010707 1.432676 
ab 3.04969 2.985616 1.14 0.255 .4476492 20.77655 





بعد تقدير النموذج يمكننا توقع predict‏ متغيرات جديدة loi. ba a‏ 
الخطر الأساسي التراكمي ودوال البقاء. وبما أن الخط الأساسي يشير إلى 
الوضعية التي تكون عندها كل متغيرات × تساوي صفراء ويجب علينا أولاً 
القيام بتمركز بعض المتغيرات حتى تكون قيم صفر لها معنىء فالمريض 
الذي وزنه صفر باوند أو ضغط دمه صفر ليس له فائدة عند إجراء عملية 
المقارنةء وباستخدام أصغر القيم في البيانات الموجودة لديناء فإنه يمكننا أن 
a gi‏ بعملية تحوير لمتغير الوزن weight‏ بحيث يشير الصفر إلى 120 باوندء 
وصفر للمتغير sbp‏ يشير إلى 105( وصفر للمتغير chol‏ يشير إلى 340: 


.summarize patient- ab 








Variable 





10.24695 





patient 18 


time 35 2580.629 616.0796 "703 3141 
coronary 35 .2285714 .426043 0 1 
weight 35 170.0857 23.55516 120 225 
sbp 35 129.7143 14.28403 104 154 










chol 35 369.2857 51.32284 343 645 
cigs 35 17.14286 13.07702 0 40 
ab 35 . 7 .5070926 0 1 


.replace weight - weight - 120 
.replace sbp = sbp - 105 
.replace chol = chol - 340 
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eSummarize patient - ab 


Obs Mean Std. Dev. Min Max 











Variable 


35 18 10.24695 1 35 


patient 
time 35 2580.629 616.0796 TIS 3141 
coronary 35 .2285714 .426043 0 2 
weight 35 50.08571 23.55516 0 105 





sbp 24.71429 14.28403 








29.28571 51.32284 3 305 
cigs 35 17.14286 13.07702 0 40 
ab 35 .5142857 -5070926 0 1 


قيم صفر لكل متغيرات × يكون لها معنى حقيقي الآن. ولإنشاء متغيرات 


جديدة تحتوي على الخط الأساسي للبقاء» وتقديرات Alla‏ الخطر التراكمي» 
فإننا نقوم بتكرار الانحدارء ونتبع ذلك بأمرين US predict‏ يلي: 


.Stcox weight sbp chol cigs ab, noshow nolog 
.predict hazard, basechazard 
.predict survivor, basesurv 


Cox regression -- no ties 
No. of subjects - 35 Number of obs  - 35 
No. of failures = 8 
Time at risk = 90322 

LR chi2(5) = 13.97 
Log likelihood = -17.263231 Prob » chi2 = 0.0158 


Std. Err. z P»|z| [95$ Conf. Interval 













Haz. Ratio 














. 9346 .0305184 -2.06 0.039 .8769919 .9967034 

sbp 1.012947 .0338061 0.39 0.700 . 94887 1.081421 
chol 1.032142 , 0139984 2.33 0.020 1.005067 1.059947 
cigs 1.203335 .1071031 2.08 0.038 1.010707 1.432676 
ab 3.04969 2.985616 1.14 0.255 .4476492 20.77655 











ويجب ملاحظة أن إنشاء ثلاثة متغيرات x‏ ليس له تأثير على نسب 


المخاطرة والأخطاء المعيارية وغيرها من الإحصائيات الأخرى. أوامر 
predict‏ تقوم بإنشاء متغيرات جديدة ويتم تسميتها عشوائيا بأسماء hazard,‏ 
survivor‏ ولإنشاء رسم بياني يمثل Ala‏ الخط الأساسي للبقاء» فإننا نقوم 
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بإنشاء رسم بياني للمتغير survivor‏ مع المتغير crime‏ ثم نقوم بتوصيل النقاط 
بطريقة تشبه السلالم كما تظهر في الشكل (3.10). 
.graph twoway line survivor time,‏ 


connect(stairstep) sort 


-4 


9 
e: 


1 


.98 


baseline survivor 


97 
سيب 





«e 
o 
dr ch — rác ———' ELE S Ly سوس‎ 
500 1000 1500 2000 2500 3000 
Time in days 
(3.10) الشكل‎ 


دالة الخط الأساسي للبقاء — والتي تصف احتمالات البقاء للمرضى الذين 
وزنهم صفر )120 باوند)» وضغط pall‏ صفر (105) والكليسترول صفر 
)340(« ولايدخنون» وهم أشخاص من نوع dcum‏ 8- تنخفض مع 
الوقت» وبالرغم من أن هذا الانخفاض يبدو كبيرً! جدا في الجانب الأيمن من 
caus‏ فإنه من الملاحظ أن الانخفاض حقيقة كان من 1 إلى نحو 0.96. 
وبالنظر إلى القيم الأقل تفضيلا للمتغيرات التنبؤية» فإن احتمالات البقاء كان 
من المفترض أن تكون أكثر انخفاضاً. 

نفس الشكل البياني لدالة الخط الأساسي للبقاء كان يمكن الحصول عليها 
بطريقة أخرى بدون الأمر cstcox.‏ وهذه الطريقة تم استخدامها لإنشاء الشكل 
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)4.10( حيث إنها تستخدم الأمر sts graph‏ مع الخيارات «adjustfor()‏ ثم بعد 
ذلك يتم إدراج المتغيرات التنيؤية. 
.Sts graph, adjustfor(weight sbp chol cigs ab)‏ 


Survivor function 
adjusted for weight sbp chol cigs ab 


1.00 
کج 


0.50 0.75 
Pd 





a | 
0 1000 2000 3000 
analysis time 


الشكل )4.10( 


الشكل )4.10(- يختلف عن الشكل )3.10( — Cus‏ 43 يعرض دالة 
البقاء العادية مع تقسيم قياس المحور العمودي ليكون من 0 إلى 1« مع وجود 
هذا الاختلاف في القياس بالمحور العمودي. الشكل (3.10) والشكل (4.10) 
يعرضان نفس المنحنى. 

الشكل )5.10( يعرض رسماً بيانياً لخط الخطر الأساسي التراكمي مع 
الوقت باستخدام المتغير hazard‏ والذي تم إنشاؤه بالأمر USA cstcox‏ يوضح 
بأن خط الخطر الأساسي التراكمي قد ازداد عند 8 OY) LLG‏ 8 مرضى 
'فشلوا" أو حدثت لهم نوبة قلبية) من 0 تقريباً إلى 0.033. 


graph twoway connected hazard time, 
connect(stairstep) sort msymbol(Oh) 
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الشكل (5.10) 


: والانحدار الأسى‎ Weibull dyg jus 
Exponential and Weibull Regression 


انحدار كوكس يقوم بتقدير دالة خط الخطر الأساسي بدون الإشارة إلى 
أي توزيع نظري. هناك العديد من المداخل المعلمية الأخرى تبدأ من 
افتراضات بأن أزمنة البقاء تتبع توزيعات نظرية معروفة. هذه التوزيعات 
تتضمن التوزيع الأسّي» وتوزيع ويبل» والتوزيع اللوغاريتمي الطبيعي» 
والتوزيع اللوغاريتمي الثنائي» وتوزيع جومبرتزء أو توزيع جاما المعياري. 
النماذج التي يتم إنشاؤها Sli‏ على أي من هذه التوزيعات يمكن اس تخدامها 

مع الأمر cstreg‏ ومثل هذه النماذج لها نفس الصيغة العامة لانحدار كوكس 
(المعادلتان ]2.10[ و [3.10]) ولكنها تعرف الخط الأساسي للخطر fo = (t)‏ 
بطريقة مختلفة. هناك مثالان عن ذلك سوف يتم تناولهما في هذا الجزء. 

إذا حدث الفشل بطريقة مستقلة مع خطر ثابت عند Aia jf‏ بقاء. وهذا 
الحدث يتبع توزيع أسّيء فإنه بالإمكان تحليله باستخدام الانحدارٍ الأسّي. الخطر 
الثابت يعني الأفراد المشاركين في Voted SSS Land Lal yall‏ أو ied‏ 
للفشل في آخر مدة المشاهدة عنهم في بدايتها. لفترة طويلة هذه الفرضية لم 
تكن مُبررة للآلات والكائنات الحية» ولكن يمكن إيقاف تأثيرها إذا كانت فترة 
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SO‏ 


المشاهدة ة تغطي جزءًا بسيطا نسبياً من فترات الحياة» النموذج (I‏ يعتمد 
على أن لوغاريتمات Alla‏ البقاء - (5()0)م1 - ترتبط hs‏ مع 1. 


المدخل المعلمي الثاني الشائع وهو انحدار ويبل» والذي يعتمد على 
jd‏ أكثر عموماء وهو توزيع ويبل» هذا لايتطلب أن تكون معدلات الفشل 
ثابتة» ولكن يسمح لهذه المعدلات بالزيادة أو النقص بشكل سلس خلال فترة 

من الزمن» نموذج ويبل يفترض بأن MENEH)‏ هو Alla‏ خطية ل Inf)‏ 
الرسومات البيانية 3 تعتبر وسيلة تشخيصية مفيدة لمعرفة مدى ملاعمة نماذج 
ويبل أو النماذج الأستية. فمثلاً وبالعودة إلى ملف بيانات aidsdia‏ نقوم بإنشاء رسم 
بياني (الشكل 6.10( In(s(?)) a‏ مقابل الزمن وذلك بعد إنشاء تقديرات كابلان- 
ميير لدالة البقاء (5)0» توصيفات المحور العمودي في الشكل (6.10) تم إعطاؤها 
رقمين ثابتين مع تنسيق يعرض رقماً [anl‏ بعد الفاصلة 042.19( ويكون اتجاه هذه 

الأرقام cad‏ وذلك حتى يمكن قراءتها بوضوح. 

.Sts gen S = S 
-generate logS = 1n(S) 


¿graph twoway scatter logS time, 
ylabel(-.8(.1)0, format (%2.1£) angle (horizontal)) 


0 60 
Months since HIV diagnosis 


الشكل )6.10( 
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hä‏ الشكل )6.10( يبدو خطياً بطريقة ما مما يدفعنا إلى محاولة الانتقال 


gd Jani إلى‎ 
.streg age, dist (exponential) nolog noshow 


Exponential regression -- log relative-hazard form 
No. of subjects - 51 Number of obs . = 51 
No. of failures = , 25 
Time at risk = 3164 
LR chi2(1) = 4.34 
Log likelihood = -59.996976 Prob » chi2 z 0.0372 
.t | Haz. Ratio Std. Err. z P>|z| {95% Conf. Interval] 
age 1.074414 - 0349626 2.21 0.027 1.008028 1.145172 
-Cons .0006811 .0007954 -6.24 0.000 .000069 .0067191 





معدل الخطر )1.074( والخطأ المعياري )0.035( تم تقديرهما بواسطة 
الانحدار UN)‏ أعلاه لا تختلفان بشكل كبير عن نظائرها في انحدار كوكس 
الذي قمنا به سابقا (1.085 و 0.038). هذا التشابه يعكس درجة الترابط بين 
دالة الخطر التجريبية والخطر الثابت والذي تم إنشاؤه بواسطة التوزيع 
الأستيء وبناءً على هذا النموذج Sul‏ فإن خطر إصابة الشخص بمرض 
HIV‏ وظهور أعراض مرض AIDS‏ تزداد بنحو %7.4 مع كل سنة زيادة 
في العمر. 

بعد إجراء الحسابات بالأمر streg‏ سوف نقوم بإنشاء رسم بياني 
باستخدام الأمر steurve‏ لنموذج الخطر التراكمي ودالة الخطر أو Allo‏ البقاءء 
والوضع الافتراضي هو أن agi‏ الأمر steurve‏ برسم هذه المنحنيات مع 
الاحتفاظ JS‏ قيم المتغيرات × في النموذج عند متوسطاتها. ويمكننا تحديد قيم 
x‏ الأخرى باستخدام الخيار cat)‏ وتجب الملاحظة أن بيانات الأشخاص 
الموجودة في الملف aids.dia‏ تتراوح ما بين 26 إلى 50 سنة» ويمكننا إنشاء 
رسم بياني لدالة البقاء عندما يكون العمر 26 - age‏ وذلك باستخدام أمر مثل: 


.Stcurve, surviv at(age - 26) 
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الشكل البياني يمكن أن يصبح أكثر تنسيقاً باستخدام الخيار att‏ والخيار 
20 لعرض منحنى البقاء باستخدام نوعين من قيم x‏ مثل أعلى وأقل قيمة 
لمتغير age‏ كما يلي: 


.Stcurve, survival atl(age = 26) at2(age = 50) 
lpattern(dash solid) 


Exponential regression 








= 
80 100 





الشكل )7.10( 


الشكل )7.10( يعرض منحنى البقاء المتوقع (للتحول من HIV‏ ويتم 
تشخيصه (AIDS‏ وهو ينخفض بدرجة كبيرة بين المرضى المُستين» حيث 
معدل المخاطرة الجوهري بالنسبة للعمر age‏ وهو أكبر من 1 في جدول 
التوزيع cowl‏ له نفس المعنى» ولكن باستخدام الأمر steurve‏ مع الخيارين 
at20 5 0‏ فإن القيم تعطي شرحاً مرئياً thy‏ أكثر قوة من الجدول. هذه 
الخيارات تعمل بطريقة مشابهة مع الأنواع الثلاثة لأمر الرسم البياني steurve‏ 


stcurve, survival‏ دالة البقاء 


stcurve, hazard‏ دالة الخطر 
steurve, cumhaz‏ دالة الخطر التراكمي 
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وبدلاً من التوزيع الأستي يمكن للأمر streg‏ صياغة نماذج بقاء تعتمد 
على توزيع ويبل. وتوزيع ويبل قد يبدو غير خطي في الرسم البياني 
ل In($())‏ مقبل الزمن «c‏ ولكن يُفترض أن يظهر بشكل خطي في الرسم 
البياني ل MENSO)‏ مقابل In)‏ مشابهاً JSAM‏ (8.10). ومن ناحية 
أخرىء» فإن التوزيع الأسّي سوف يظهرخطياً في كلا الشكلين البيانيين مع 
ميل يساوي 1 في InCIn(S())‏ مقابل الرسم البياني ل nA‏ وفي الحقيقة 
فإن بيانات المرضى في الشكل (8.10) قريبة من العلاقة الخطيّة مع ميل 
يساوي el‏ وهذا يعني أن النموذج الأسّي السابق كان كافياً. 
.generate loglogS = 12)-12):5((‏ 
.generate logtime - ln(time)‏ 


.graph twoway scatter loglogS logtime, 
ylabel(,angle(horizontal)) 
ل‎ 


loglogS 





logtime 


الشكل )8.10( 


ولذلك؛ فإننا لانحتاج إلى تعقيدات CY AÍ‏ نموذج من نماذج ويبل مع 
هذه البيانات والنتائج تم عرضها بالجدول أدناه. 


.Streg age, dist(weibull) noshow nolog 
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Weibull regression -- log relative-hazard form 
No. of subjects - 51 Number of obs = 51 
No. of failures - 25 
Time at risk = 3164 

LR chi2(1) = 4.68 
Log likelihood = -59.778257 Prob > chi2 = 0.0306 













Haz. Ratio [95$ Conf. Interval] 





1.079477 .0363509 2.27 0.023 1.010531 1.153127 
-cons . 0003313 -0005415 -4.90 0.000 .0000135 . 0081564 
/1n_p . 8 . 1820858 0.68 0.498 -.2336179 .4801454 
















1.131183 .2059723 .7916643 1.616309 


1/p .8840305 .1609694 .6186934 1.263162 





انحدار ويبل يحسب معدل المخاطرة ويقدرها ب )1.079( وهو يتوسط 
بين نتائج كوكس السابقة والنتائج ALYY‏ الاختلاف الأكثر وضوحاً في النماذج 
السابقة» هو وجود ثلاثة خطوط جديدة في أسفل الجدول» وهي تشير إلى معلمة 
شكل توزيع ويبل م. وعندما تكون قيمة م تساوي cL‏ فإن ذلك يعني أنها تتعلق 
بنموذج «ull‏ والمخاطر لاتتغير بمرور الزمن. أما إذا كانت 1 <م فهذا يشير 
إلى أن المخاطر تزداد مع الوقت» وفي حالة أن 1 p<‏ فهذا يعني أن المخاطر 
تنخفض» وفترة الثقة %95 لمعلمة توزيع p das‏ تتراوح ما بين 0.79 و1.62 
ولذلك فليس لدينا أي سبب لرفض النموذج الأسّي )1 = (p‏ هناء نموذج وييل 
يركز على In(p) p, Up‏ هذا التركيز يتم بشكل مختلف» ولكن رياضيا متساوي» 
ولذا فإن برنامج ستاتا يوفر هذه الطرق الثلاثء فالأمر steurve‏ يقوم بإنشاء 
رسم بياني لدوال المخاطرة التراكمية؛ أو دوال المخاطرء أو دوال البقاء بعد 
الأمر streg, dist(weibull)‏ كالذي تم القيام بهبعدالأمر streg,‏ 
dist(exponenetial)‏ أو النماذج الأخر ى ل -streg‏ 

الانحدار الأمتي أو انحدار ويبل أكثر تفضيلاً من انحدار كوكس Laie‏ 
تكون أزمنة البقاء تتبع توزيعاً Lal‏ أو توزيع ويبل. ولكن عند صياغة نماذج 
الانحدار هذه بطريقة خاطئةء فإننا سوف نحصل على نتائج مضللة. انحدار 
كوكس- والذي لايعتمد على أي افتراضات سابقة حول شكل التوزيع - يبقى 
الأداة المفضلة في حالات كثيرة. 
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بالإضافة إلى النماذج ALY)‏ ونماذج cda‏ فإنه بالإمكان استخدام الأمر 
streg‏ في صياغة العديد من النماذج التي تعتمد على توزيع جومبرتز» 
والتوزيع اللوغاريتمي الطبيعي» والتوزيع اللوغاريتمي الثنائي» وتوزيع Lla‏ 
المعياري. وللحصول على معلومات أكثر حول تركيبة الأمر وخياراته» قم 
بطباعة الأمر help streg‏ أو الاطلاع على دليل المستخدم Survival Analysis‏ 
-and Epidemiological Tables Reference Manual‏ 


Poisson Regression : بوأسون‎ jus 

)13 كانت الأحداث تقع بشكل مستقل وبمعدل ثابت» فإن عدد الأحداث 
خلال فترة معينة من الزمن» تتبع توزيع بواسون. بافتراض أن ry‏ تمثل معدل 
الوقوع فإن: 


عدد الأحداث 


n- [4.10] 


عدد مرات احتمال وقوع الحدث 

المقام في المعادلة أعلاه [10.4] يُطلق عليه "التعرّض" وفي العادة يتم 
قياسه بوحدات مثل شخص/ Aiu‏ نقوم بصياغة النموذج اللوغاريتمي لمعدل 
الوقوع كدالة خطيّة لواحد أو أكثر من المتغيرات التنبؤية: 


In(r) = Bo + Bı xı + B2 x2 +... + Bex [a5.10] 
وبنفس الطريقة؛ فإن النموذج أعلاه يشرح لوغاريتمات وحدات الأحداث‎ 
المتوقعة:‎ 


In(ed stall (التعرّض)ح1 = (العدد‎ + Bo + Bi ,د‎ + 82 x2 + ... + Bex — [b5.10] 

وبافتراض أن التقدم في توزيع بواسون يوضح الحدث المراد دراسته» 
فإن انحدار بواسون سوف يحسب تقدير الاحتمال الأعلى لمعلميات 6. 

سوف يكون لدينا مثال يحتوي على بيانات عن التعرض للإشعاعات 
والموت بمرض السرطان بين عمال المعمل الوطني في أوك ريدج بالولايات 
المتحدة» هناك 56 مشاهدة Cala‏ البيانات oakridege.dta‏ تمثل 56 عمر/ فئة 
تعرضت للإشعاع (7 فئات عمرية X‏ 8 فئات تعرضت للإشعاع)؛: لكل 
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مجموعة نحن نعرف عدد حالات الوفاةء وعدد الفئات العمرية المتعرضة 














للاشعا 
2 € 
.use C:\data\oakridge.dta, clear‏ 
-describe‏ 
Contains data from C:\data\oakridge.dta‏ 
obs: 56 Radiation (Selvin 1995:474)‏ 
vars: 4 2 Jul 2012 06:11‏ 
size: 392‏ 
storage display value‏ 
variable name type format label variable label‏ 
age byte $9.0g ageg Age group‏ 
rad byte $9.0g Radiation exposure level‏ 
deaths byte $9.0g Number of deaths‏ 
pyears float 59.09 Person-years‏ 
Sorted by:‏ 
.Summarize‏ 
Variable Obs Mean Std. Dev. Min Max‏ 
age 56 4 2.0181 1 7‏ 
rad 56 4.5 2.312024 1 8‏ 
deaths 56 1.839286 3.178203 0 16‏ 
pyears 56 3807.679 10455.91 23 71382‏ 


.list in 1/6 


rad deaths pyears 


uk C ON جم‎ 





هل معدل الوفيات زاد مع التعرض للإشعاع؟ انحدار بواسون وجد أن 
هناك تأثيرًا ذا معنوية إحصائية: 


. poisson deathsrad, nolog exposure(pyears) irr 
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Poisson regression Number of obs = 56 
LR chi2 (1) = 14.87 
Prob > chi2 = 0.0001 
Log likelihood = -169.7364 Pseudo R2 = 0.0420 











deaths IRR Stå. Err. z P>|z| [95$ Conf. Interval] 





rad 





1.236469 .0603551 4.35 0.000 1.123657 1.360606 
.000288 .0000483 -48.65 0.000 .0002074 .0004 
1 (exposure) 


_cons 
in (pyears) 






بالنسبة لتحليل الانحدار odef‏ قمنا بتحديد عدد مرات وقوع الحدث 
(deaths)‏ كمتغير تابع» والإشعاع (rad)‏ كمتغير مستقل. متغير التعرض 
لبواسون هو pyears‏ أو شخص/ سنة في كل فئة للمتغير rad‏ الخيار irr‏ يقوم 
بعرض نسب معدل الوقوع Yay‏ من مُعَاملات الانحدار في جدول النتائج؛ 
حيث حصلنا على ga Ya exp(f)‏ قيمة 8 فقط وهو الوضع الافتراضي. 
وحسب نسبة معدل الوقوع» فإن معدل الوفيات أصبح 1.236 مرة أعلى 
(زيادة بنسبة 623.6( مع كل زيادة في فئة الإشعاع» وبالرغم من أن ذلك 
المعدل ذو معنوية إحصائية» فإنه غير متناسب بدرجة كبيرة» حيث إن R‏ 
الوهمية (المعادلة ]9.4[( تساوي 0.042 فقط. 

وللقيام باختبار حسن المطابقة الذي يقوم بمقارنة توقعات نموذج بواسون 
مع الأعداد المشاهدة نقوم باستخدام أمر ما بعد التقدير „estat gof‏ 


.estat gof 
Deviance goodness-of-fit - 254.5475 
Prob » chi2(54) = 0.0000 
Pearson goodness-of-fit = 419.0209 
Prob > chi2(54) = 0.0000 


نتائج اختبار حُسن المطابقة تشير إلى أن توقعات النموذج تختلف بدرجة 
كبيرة عن الأعداد الحقيقية. وهذه إشارة أخرى إلى أن النموذج tea‏ بدرجة 
كبيرة. 
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يمكننا الحصول غلى نتائج daia‏ عندما نقوم بإدراج المتغير ge‏ 
كمتغير تنبؤي. حيث da 3i‏ قيمة R?‏ الوهمية لتكون 60.5966 prr d LS‏ 


خسن المطابقة ة لا يقود إلى رفض النموذج. 
.poisson deaths rad age, nolog exposure(pyears)‏ 





irr 
Poisson regression Number of obs z 56 
LR chi2(2) = 211.41 
Prob > chi2 = 0.0000 
Log likelihood = -71.4653 Pseudo R2 = 0.5966 


















deaths 





IRR Std. Err. (95% Conf. Interval] 





rad 1.176673 0593446 3.23 0.001 1.065924 1.298929 

age 1.960034 . 0997536 13.22 0.000 14213955 2.165631 

cons .0000297 9.05e-06 -34.18 0.000 .0900163 .0000539 
ln(pyears) 1 (exposure) 





.-poisgof 
Deviance goodness-of-fit -  58.00534 
Prob » chi2(53) = 0.2960 
Pearson goodness-of-fit = 51.91816 
Prob > chi2(53) = 0.5163 


حتى الآن قمنا بمعاملة المتغير rad‏ والمتغير age‏ كأنهما متغيران 
متصلان» ونحن نتوقع أن تأثيرهما على معدل الوفيات سوف يكون تأثيرا 
خطياًء وفي الحقيقة كلا المتغيرين المستقلين تم قياسهما كفئات i pa‏ فمئلاً 
عندما تكون 1 = rad‏ فهذا يعني 0 تعرّض للإشعاع؛ 2 = rad‏ يعني أنه من 0 
إلى 19 مللي» 3 = rad‏ يعني من 20 إلى 39 مللي وهكذاء الطريقة البديلة 
لإدراج فئات التعرض للإشعاع في تحليل الانحدار لإيجاد التأثيرات غير 
الخطيّة يتم من خلال إدراجها كمجموعة متغيرات تنبؤية باس تخدام تدوين 
المتغير العاملي ببرنامج ستاتاء المصطلح irad‏ في النموذج أدناه يقوم بتحديد 
1 ,0( كمؤشر لكل فئة للمتغير rad‏ تم إدراجها مع المتغير التنبؤي «age‏ 
وعندما تكون 1= rad‏ فإنه يتم إهمالها تلقائياً ويتم اعتبارها 448 أساسية. 
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.poisson deaths i.radage, nolog 
exposure(pyears) irr 


Poisson regression Number of obs = 56 
LR chi2(8) = 215.44 
Prob > chi2 = 0.0000 
Log likelihood = -69.451814 Pseudo R2 = 0.6080 















IRR Std. Err. 2 P>|z| [95$ Conf. Interval 





2 1.473591 .426898 1.34 0.181 .8351884 2.599975 

3 1.630688 .6659257 1.20 0.231 .732428 3.630587 

4 2.375967 1.088835 1.89 0.059 .9677429 5.833389 

5 .7278113 .7518255 -0.31 0.758 .0961018 5.511957 

6 1.168477 1.20691 0.15 0.880 .1543195 8.847472 

7 4.433729 3.337738 1.98 0.048 1,013863 19.38915 

8 3.89188 1.640978 3.22 0.001 1.703168 8.893267 

age 1.961907 .1000652 13.21 0.000 1.775267 2.168169 

_cons 0000295 . 0000106 -29.03 0.000 .0000146 .0000597 

1n (pyears) 1 (exposure) 


هذا التعقيد الإضافي لنموذج المتغير التنبؤي قام بجعل النموذج أكشر 
ملاءمة» حيث أضاف إلى تفسير النتائج. فالتأثير الكلي للإشعاع على معدل 
الوفيات يبدو أنه كانت نتيجة أساسية لأعلى مستويين من مستويات الإشعاع 
rad = 8 «rad= 7)‏ وهي ترتبط ب 100 إلى 119 و120 مللي)؛ وعند هذه 
المستويات» فإن معدلات الوقوع تكون أعلى بأربع مرات تقريباً. 
مستويات الإشعاع 7 و8 يبدو أن لها تأثيرات متشابهة» ولذا فإننا قد 
نبستط النموذج من خلال توحيد هذه المستويات. أولا سوف نختبر ما lj‏ 
كانت COLL!‏ تختلف بشكل جوهريء وهي في الحقيقة لا تختلف بشكل 
جوهري: 
4ت . 8 = .test 7.rad‏ 


( 1) [deaths]7.rad - [deaths]8.rad - 0 


0.03 
0.8676 


chi2( 1) 
Prob » chi2 


الفصل العاشر : نماذج عد الأحداث والبقاء 483 
ام dd‏ ا 


ثم بعد ذلك نقوم بإنشاء متغير وهمي جديد باسم rad78‏ وهو يساوي 1 
إذا كان rad‏ يساوي 7 أو 8؛ ونستخدم هذا المتغير الجديد بدلاً من المؤشرات 
rad =7‏ و8 =#ه» الأوامر أدناه توضح كيف يمكننا القيام بذلك في تدوين 
المتغير العاملي. 

«generate rad78 = (7.rad | 8.rad) 


poisson deaths i(1/6).radrad78age, irr 
ex(pyears) nolog 


Poisson regression Number of obs = 56 
LR chi2(7) = 215.41 
Prob > chi2 = 0.0000 
Log likelihood = -69.465332 Pseudo R2 = 0.6079 














deaths IRR Std. Err. 2 P»|z| [95$ Conf. Interval] 











2 1.473602 .4269013 1.34 0.181 .8351949 2.599996 

3 1.630718 . 6659381 1.20 0.231 + 7324415 3.630655 

4 2.376065 1.08888 1.89 0.059 . 9677823 5.833629 

5 + 7278387 . 7518538 -0.31 0.758 . 0961055 5.512165 

6 1.168507 1.206942 0.15 0.880 - 1543236 8.847704 

rad78 3.980326 1.580024 3.48 0.001 1.828214 8.665833 
age 1.961722 -100043 13.21 0.000 1.775122 2.167937 

-cons -0000296 -0000106 -29.03 0.000 - 0000146 .0000598 

1n(pyears) 1 (exposure) 





یمکننا الاستمرار في تبسيط النموذج أكثر بنفس هذه الطريقة» وفي كل 
خطوة فإن الأمر test‏ يساعدنا في تقييم ما إذا كان توحيد متغيرين وهميين 
يمكن تبريره. 


Generalized Linear Models : الخطية العامة‎ losi 





النماذج الخطية العامة (GLM)‏ تكون صيغتها كما يلي: 
g[EQJ] = Bo + Bix + Boxa +... + Bx g~ F [6.10]‏ 
حيث إن ] ]ع عبارة عن F clas Jl Alla‏ مجموعة التوزيع» وهذه الصيغة 
العامة تتضمن العديد من النماذج المحددة. فعلى سبيل المثالء إذا كانت [ ]ع 
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هي دالة الوحدة؛ وبرتتبع توزيعاً طبيعياً (جاوس)؛ فإن صيغة نموذج الانحدار 
الخطي تكون: 
[7.10] توزيع ene‏ مق + ... + E(y) = Bo + Bixi + 82x»‏ 

وإذا كانت [ Api le sl Alla gf‏ ور تتبع توزيع برنولي» فإن صيغة 
نموذج الانحدار اللوغاريتمي تكون: 

Logit[E(y)] = Bo + Bii + 82x» + ... + Buil so: توزيع‎ [8.10] 

وحيث إن هذا النموذج قابل للتطبيق في مجالات bac‏ فإن GLM‏ كان 
يمكن استخدامه في ol jal‏ مختلفة من هذا الكتاب» وعلاقة GLM‏ بهذا الفصل 
تأتي من قدرته على التناسب مع نماذج الأحداث. فمثلاً انحدار بواسون 
يتطلب أن تكون gf]‏ دالة لوغاريتم طبيعي» وأن «ريتبع توزيع بواسون. 

In[EQ)] > Bo + Bim + Baxa + ... + توزيع بواسون سنوهمم‎ [9.10] 

وكما vici meo dias‏ فإن الأمر gim‏ ببرنامج ستاتا 
يسمح بالعديد من الخيارات. والمستخدمون يمكنهم تحديد ليس hä‏ نوع 
التوزيع ودالة cay sll‏ وإنما إيضاً تفاصيل تقدير التباين» والإجراء المناسب» 
والمخرجات والتعرض. هذه dune‏ الأمر gim‏ بديلاً مفيدًا حتى عند 
تطبيقه على النماذج التي لها أوامر خاصة بها موجودة مسبقاً (مثل  regress,‏ 
(logistic, poisson‏ . 

يمكننا كتابة الأمر glm‏ بصيغته العامة كما يلي: 


glm y x1 x2 x3, family(familyname) 
link(linkname) 
exposure(expvar) eform vce( jackknife) 


حيث إن ) family(‏ 2223 نوع توزيع Alla link( ) y‏ الربط ) exposure(‏ 
متغير التعرض مثل ذلك الذي نحتاج إليه في انحدار بواسونء والخيار 
eform‏ يقوم بعرض مُعاملات الانحدار في شكل (Gd‏ حيث إنها تظهر على 
شكل You exp(B)‏ من dB‏ ويتم تقدير الأخطاء المعيارية من خلال حسابات 
جاكنيف .jackknife calculations‏ 
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وأنواع التوزيعات 


family(gaussian) 


family(igaussian) 
family(binomial) 
family(poisson) 
family(nbinomial) 


family(gamma) 
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المحتملة هي: 

توزيع جاوس أو التوزيع الطبيعي (وهذا هو الوضع 
الافتراضي). 

معكوس توزيع جاوس. 

توزيع برنولي ذو الحدين. 

توزيع بواسون. 

التوزيع السالب ذو الحدين. 


توزيع جاما. 


يمكننا أيضاً تحديد رقم أو متغير يشير إلى كسر ذي حدين N‏ (عدد 
المحاولات) أو رقم يشير إلى التباين السالب ذي حدين ودوال الانحراف» 
وذلك من خلال تحديدها في الخيار family()‏ كما يلي: 
family(binomial#)‏ 


family(binomial varname) 
family(nbinomial #) 


دوال الربط المحتملة هي: 


Alla link(identity)‏ الربط baa gall‏ (هذا هو الوضع الافتراضي). 
link(log)‏ لوغاريتم. 
 link(logit)‏ الدالة اللوغاريتمية. 
link(probit)‏ دالة الاحتمال. 
link(cloglog)‏ دالة المتمم اللوغاريتمي. 
link(opower #)‏ قوة الاحتمالات. 
link(power #)‏ دالة القوة. 
 link(nbinomial)‏ ذو الحدين السالب. 
link(loglog)‏ لوغاريتم - لوغاريتم. 
link(loge)‏ اللوغاريتم المتمم. 


l 486‏ الإحصاء مع برئامج ستاتا 


مُعامل التباين أو الأخطاء المعيارية يمكن تقديرها بعدة طرق» جزء من 
خيارات تقدير التباين gim‏ هي كما يلي: 
opg‏ مقذر التباين ل هال Hall‏ وهال وهوسمان بي إتش 
التكعيبي «Hall and Hausman B-H-cubed‏ وبرندت Berndt‏ . 
oim‏ مقذر تباين مصفوفة المعلومات المشاهدة. 
robust‏ مقذر الشطيرة لتباين هوبر/وايت .Huber/White‏ 
unbiased‏ مقذر الشطيرة غير المتحيز للتباين. 
ie nwest‏ تباين الارتباط الذاتي الثابت واختلاف التباين. 
jackknife‏ تقدير جاكنيف للتباين. 
 jackknifel‏ تقدير جاكنيف ذو الخطوة الواحدة للتباين. 
bpotstrap‏ تقدير بوتستراب Bootstrap‏ للتباين» الوضع الافتراضي هو 
9 تكراراء ويمكن تحديد رقم تكرار معين عن طريق 
إضافة ذلك من خلال الخيار bstrep(#)‏ 


للحصول على قائمة كاملة بالخيارات مع بعض التفاصيل التقنية حولهاء 
قم بالبحث عن gim‏ في دليل المستخدم «Base Reference Manual‏ وللحصول 
على شرح أكثر تفصيلاً عن موضوعات GLM‏ يمكنك الاطلاع على دراسة 
Hardin and Hilbe‏ (2012). 

الفصل (7) بدأ مع الانحدار البسيط لمتوسط العمر المتوقع على متوسط 
سنوات الدراسة في 188 دولة. 


.use C:\data\Nations2.dta, clear 
.regress life school 
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Source SS df MS Number of obs - 188 
PE 5 186) = 206.34 

Model 9846.65406 1 9846.65406 Prob» F - 0.0000 
Residual 8875.86926 186 47.7197272 R-squared = 0.5259 
Adj R-squared = 0.5234 

Total 18722.5233 187 100.120446 Root MSE = 6.9079 
life Coef. Std. Err. E P»|t| [95$ Conf. Interval 
school 2.45184 .1706856 14.36 0.000 2.115112 2.788569 
_cons 50.35941 1.36924 36.78 0.000 47.65817 53.06065 





يمكننا إنشاء نفس النموذج والحصول على نفس التقديرات من Dus‏ 
استخدام الأمر -gim‏ 
-glm life school, link(identity) family (gaussian)‏ 


Iteration 0: log likelihood - -629.09751 


Generalized linear models No. of obs = 188 

Optimization : ML Residual df = 186 

Scale parameter = 47.71973 

Deviance = 8875.869256 (1/df) Deviance = 47.71973 

Pearson = 8875.869256 (1/df) Pearson = 47.71973 
Variance function: V(u) = 1 [Gaussian] 
Link function : g(u) =u [Identity] 

. AIC = 6.713803 

Log likelihood = -629.0975058 BIC - 7901.891 







OIM 
Coef. Std. Err. 2 P»|z| [95$ Conf. Interval 









life 






2.45184 
50.35941 


.1706856 
1.36924 


14.36 
36.78 


2.117303 
47.67575 


2.786378 
53.04307 










وحيث إن link(identity) S‏ والخيار family(gaussian)‏ هما . 
الخيارات الافتراضية»ء فيمكننا تركهما وعدم طباعتهما في الأمر أعلاه «glm‏ 
وسوف نحصل على نفس النتائج. 
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كما أنه بالإمكان صياغة نفس النموذج OLS‏ ولكن نحصل على أخطاء 
معيارية مقذرة عن طريق بوتستراب. 


.gim life school, link(identity) 
family(gaussian) vce(bootstrap) 


(running glm on estimation sample) 


Bootstrap replications (50) 


— — — — —Ó— H——Ó NC € 50 
Generalized linear models No. of obs - 188 
Optimization : ML Residual df = 186 
Scale parameter = 47.71973 
Deviance = 8875.869256 (1/df) Deviance = 47.71973 
Pearson = 8875.869256 (1/df) Pearson = 47.71973 
Variance function: V(u) = 1 [Gaussian] 
Link function : gu) =u [Identity] 
AIC - 6.713803 
Log likelihood = -629.0975058 BIC = 7901.891 















Observed 
Coef. 


Normal-based 
[95% Conf, 


Bootstrap 
Std. Err. 









Interval] 
























.1436837 
1.29733 






2.45184 
50.35941 


2.733455 
52.90213 


2.170225 
47.81669 


17.06 
38.82 


الأخطاء المعيارية لبوتستراب تعكس التباين المشاهد بين CDL RA‏ 
المقترة من 50 عينة تحتوي على 188 = «. حالة تم الحصول عليها بطريقة 
المعاينة العشوائية مع استبدال البيانات الأصلية 188 n=‏ في هذا المثال 
الأخطاء المعيارية لبوتستراب أقل من الأخطاء المعيارية النظرية ذات 
العلاقة ونتج عنها فترات ثقة أصغر. 

وبالمثل» فإنه يمكننا استخدام الأمر ”اع لتكرار الانحدار اللوغاريتمي 
مع بيانات مكوك الفضاء الذي سبق لنا استخدامها في الفصل (9). في هذا 
المثال» قمنا بحساب الأخطاء المعيارية لجاكنيف ومعدل الاحتمالات أو 
عرض co‏ في شكل اسي (eform)‏ 
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.use C:\data\shuttle0.dta, clear 
.glm any date, link(logit) family (bernoulli) 
eform vce(jackknife) 


(running glm on estimation sample) 
Jackknife replications (23) 


Generalized linear models No. of obs = 23 
Optimization : ML Residual df = 21 
Scale parameter = 1 
Deviance = 25.98219269 (1/d£) Deviance = 1.237247 
Pearson = 22.8885488 (1/df) Pearson = 1.089931 
Variance function: V(u) = u*(1-u/1) [Binomial] 
Link function : g(u) = In(u/(1-u)) [Logit] 
AIC = 1.303574 
Log likelihood = -12.99109634 BIC = -39.86319 






Jackknife 
Odds Ratio Std. Err. t P»|t| [95% Conf. Interval] 















1.002093 .0015797 1.33 0.198 .9988222 1.005374 


_cons 1.34e-08  1.89e-07 -1.28 0.214 2.32e-21 76840.52 





انحدار بواسون مع متغيرات تنبؤية تم التطرق إليه سابقا فى Ioa‏ 
الفصل. B‏ 

.use C:\data\oakridge.dta, clear 

poisson deaths i.rad age, nolog exposure (pyears) 


irr 
أدناه:‎ gim وهو يتوافق مع نموذج‎ 
.gim deaths i.rad age, link (1og) 
family (poisson) exposure (pyears) eform 
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ARE ‘ee‏ لدت ف كلت سيا 


Iteration 0: log likelihood = -75.68551 
Iteration 1: log likelihood = -69.595462 


Iteration 2: log likelihood - -69.452909 
Iteration 3: log likelihood - -69.451814 
Iteration 4 log likelihood - -69.451814 
Generalized linear models No. of obs z 56 
Optimization : ML Residual df = 47 
Scale parameter = 1 
Deviance = 53.97836926 (1/d£) Deviance = 1.148476 
Pearson = 53.59824023 (1/df£) Pearson = 1.140388 
Variance function: V(u) = u [Poisson] 
Link function : g(u) = In(u) [Log] 
AIC = 2.801851 
Log likelihood  - -69.451814 BIC = -135.2132 











OIM 


Std. Err. [55% Conf. Interval] 












2 1.473591 .426898 1.34 0.181 .8351884 2.599975 

3 1.630688 .6659257 1.20 0.231 .732428 3.630587 

4 2.375967 1.088835 1.89 0.059 .9677429 5.833389 

5 .7278114 .7518256 -0.31 0.758 .0961019 5.511958 

6 1.168477 1.20691 0.15 0.880 .1543196 8.847472 

7 4.433727 3.337737 1.98 0.048 1.013862 19.38915 

8 3.89188 1.640978 3.22 0.001 1.703168 8.89326; 

age 1.961907 .1000652 13.21 0.000 1.775267 2.168169 

.cons .0000295 .0000106 -29.03 0.000 .0000146 .0000597 

in(pyears) 1 (exposure) 






بالرغم من أن الأمر gim‏ يكرر النماذج التي تم صياغتها بواسطة أوامر 
متخصصة» كما أضاف بعض القدرات الجديدة. هذه الأوامر المتخصصة لها 
ميزاتها التي منها السرعة وتوافر خيارات التخصيص. الميزة الأساسية للأمر 
gim‏ هي قدرته على التلاؤم مع نماذج ستاتا التي ليس لها أوامر خاصة بها. 


تحليل المكونات الرئيسية 
التنحليل ال#املي والتحليل العنقودي 


Principal Component, Factor 
And Cluster Analysis 








تحليل المكونات uas jl‏ والتحليل العاملي تعتبر طرق تبسيط وتوحيد 
العديد من المتغيرات المترابطة في عدد أصغر للأبعاد الضمنية. خلال 
خطوات التبسيطء يجب على المحلل الاختيّار من بين عدد كبير من الخيارات 
الصعبة. وإذا كانت البيانات تعكس أبعادًا ضمنية مختلفة»ء فإن الخيارات 
المختلفة قد تؤدي إلى الحصول على نتائج متشابهة. وفي غياب أبعاد ضمنية 
مختلفةء فإن الخيارات المختلفة قد تؤدي إلى الحصول على نتائج مختلفة. 
التحليل باستخدام هذه الخيارات يوضح كيف أن نتيجة معينة مستقرة أو إلى 
أي مدى تعتمد هذه النتيجة على خيارات عشوائية يتم اختيارها بناءً على 
الطريقة المستخدمة في التحليل. 

يقوم برنامج ستاتا بإجراء تحليل المكونات الرئيسة» والتحليل العاملي 
ناكما تة أذ امير رئيسة هي: 

Pea‏ تحليل المكونات الرئيسة. 
Factor‏ استخراج عوامل وأنواع مختلفة متعددة تتضمن المكونات 
الرئيسة. 


3 


agi Screeplot‏ بإنشاء euo‏ الحصى والحجارة (رسم بياني للجذر 
الكامن) من آخر نتيجة للأمر E. pea‏ الأمر factor‏ 
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Rotate‏ يقوم بحساب التدوير المتعامد al ge)‏ غير مترابطة) أو 
التدوير المائل (عوامل مترابطة) بعد الأمر factor‏ 


لحالات أخرى بعد الأمر factor‏ أو الأمر pea‏ أو الأمر. 


rotate 


درجات العوامل أو المتغيرات المركبة يتم إنشاؤها عن طريق الأمر 
«predict‏ ويمكن حفظها ووضعها في قوائم وتمثيلها Lily‏ وتحليلها مثلها مثل 
متغيرات ستاتا الأخرى» سوف يتم توضيح مثل هذا التحليل في جزء جديد 
باستخدام مثال يتضمن بيانات دراسة استقصائية. 

المستخدمون الذين يقومون بإنشاء متغيرات مركبة باستخدام طرق 
معقدة» تقوم بإضافة متغيرات أكروئ معا يتوق القيام بإجراء تحليل عاملي 
يمكنهم من تقييم نتائجهم من خلال احتساب (tal) a‏ معامل الثبات: 
ألفا ثبات كرونباخ Cronbach‏ ». 

فبدلاً من دمج المتغيرات» فإن التحليل العنقودي يدمج المشاهدات» وذلك 
من خلال إيجاد عدم التداخل» وإنشاء مجموعات أو تصنيفات على أساس 
عملي. طرق التحليل العنقودي أكثر تنوعاً من طرق التحليل العاملي. والأمر 
cluster‏ له عدة أدوات يمكنه من خلالها إجراء التحليل العنقوديء وتمثيل 
النتائج Lily‏ وإنشاء متغيرات جديدة لتحديد المجموعات التي ظهرت فى 
النتائج. تحليل المكونات الرئيسةء والتحليل العاملي» والتحليل العنقودي 
والأوامر المتعلقة بها تم توضيحها بالتفصيل في دليل المستخدم ا 
ببر نامج Multivariate Statistics Reference Manual Ua‏ . 

يختم هذا الفصل موضوعه بإلقاء نظرة ثانية على قدرات نماذج المعادلة 
المركبة لبرنامج ستاتا (sem)‏ المستخدمة لقياس النماذج التي تتضمن قياس 
نموذج المكونات. 


الفصل الحادي عشر : تحليل المكوّنات الرئيسة والتحليل العَامِلي والتحليل العنقودي 493 
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الطرق التي سوف يتم شرحها في هذا الفصلء يمكن الوصول إليها عبر 
قوائم ستاتا التالية: 

Statistics < Multivariate analysis 

Graphics < Multivariate analysis graphs 

Statistics » SEM (structural equation modeling) 


أمثلة عن الأوامر : Example Commands‏ 


.pca x1-x20 
×1 يقوم بحساب المكونات الرئيسة للمتغيرات التي تبدأ من المتغير‎ 
.×20 وحتى المتغير‎ 
.pca x1-x20, mineigen(1) 
×1 يقوم بحساب المكونات الرئيسة للمتغيرات التي تبدأ من المتغير‎ 
وحتى المتغير 20 ويقوم بحفظ المكونات التي تكون قيمة الجذر الكامن لها‎ 
.1 أكبر من‎ 
.factor x1-x20, ml factor (5) 
يقوم بحساب التحليل العاملي بطريقة الأرجحية العظمى للمتغيرات من‎ 
خمسة عوامل فقط.‎ Jd ويقوم بحفظ‎ a2 وحتى‎ x/ 
.Screeplot 
لعدد من‎ c AL SII يقوم بإنشاء رسم بياني للحصى والحجارة للجذر‎ 
-factor من آخر نتائج للأمر‎ fas المكونات‎ 
.rotate, varimax factors(2) 
يقوم بحساب التدوير المتعامد (أكبر تباين) لأول عاملين اثنين من آخر‎ 


factor you نتائج‎ 
.rotate, promax factors(3) 


يقوم بحساب التدوير المائل (تدوير المحاور) لأول ثلاثة dal se‏ من آخر 
نتائج factor o4‏ ش 
predict f1 f2 £3‏ 
يقوم هذا الأمر بإنشاء ثلاثة متغيرات عامليّة جديدة باسم PLE 3, 2, fl‏ 
على آخر نتائج للأمر ‘rotate yall factor‏ 


.alpha x1-x10 
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يقوم بحساب معدل الثبات » لكرونباخ لمتغير مركب ويُعرف بأته 
السلبية. والخيارات التي تتعلق بهذا الأمر يمكنها تغيير هذا الوضع 
الافتراضي» أو إنشاء متغير تركيبي من خلال إضافة المتغيرات الأصلية أو 
قيمها المعيارية. 


„cluster centroidlinkage x y z w, measure(L2) 
name (L2cent) 


التقاطع با ستخدام المتغير ات x, y zw‏ وتقوم مسافة إقليدس (L2)‏ بقياس 
الاختلاف بين المشاهدات. والنتائج من هذا التحليل العنقودي يتم حفظها باسم 
-L2cent‏ 


.cluster dendrogram, ylabel(0(.5)3) cutnumber(20) 
xlabel(, angle(vertical)) 


يقوم بإنشاء رسم بياني لشجرة التحليل العنقودي تعرض نتائج آخر أمر 
للتحليل العنقودي. الخيار cutmumber(20)‏ يحدد بأن الرسم البياني يبدأ مع 
ال 20 Ia e‏ المتبقية بعد اضمحلال أغلب المشاهدات المتشابهة. وتتم 
طباعة توصيفات لهذا الشكل البياني في شكل عمودي أسفل الشكل نفسه. 
.cluster generate ctype - groups(3), name (L2cent)‏ 
يقوم بإنشاء متغير جديد باسم cope‏ (قيمه 1 أو 2 أو 3( تقوم بتصنيف 
كل مشاهدة في واحدة من أعلى ثلاث مجموعات تم إنشاؤها باستخدام التحليل 
العنقودي الذي توجد نتائجه في .L2cent‏ 


: كليل اطلكوتات الرئيسة والتحليل العاملي للمكونات الرئيسة‎ 
Principal Component Analysis and Principal 
Component Factoring 


لتوضيح التحليل العاملي» وتحليل المكونات الرئيسة؛ سوف نبدأ مع 
مجموعة بيانات صغيرة موجودة بالملف 4 نتشرح التسع كواكب 
التقليدية بالنظام الشمسي (هذه البيانات من دراسة Beatty et al.‏ 1981(« 
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البيانات تتضمن مجموعة من المتغيرات في USA S old USS‏ لوغاريتمي 
وتم استخدام اللوغاريتمات هنا لتقليل الالتواء» وجعل العلاقات أكثر خطيّة 


بين المتغيرات. 

.use C:\data\planets.dta, clear 
describe 

Contains data from C:\data\planets.dta 

obs: 9 Solar system data 

vars: 12 2 Jul 2012 06:11 

size: 405 
————— MM Ó——MM— — € € 

storage display value 

variable name type format label variable label 
MEM C Cc ل ص‎ 
planet str? $9s Planet 
dsun float %9.0g Mean dist. sun, km*10^6 
radius float %9.0g Equatorial radius in km 
rings byte $8.0g ringlbl Has rings? 
moons byte $8.0g Number of known moons 
mass float $9.0g Mass in kilograms 
density float %9.0g Mean density, g/cm^3 
logdsun float %9.0g natural log dsun 
lograd float %9.0g natural log radius 
logmoons float %9.0g natural log (moons + 1) 
logmass float %9.0g natural log mass 
logdense float %9.0g natural log dense 


Sorted by: dsun 


نتائج تحليل المكونات الرئيسة توضح بأن هناك تركيباً خطياً يشرح 
أعلى قيمة للتباين في المتغيرات التي تم مشاهداتها ويسمى sS‏ رئيس 
أول". us‏ أن النتائج أوضحت al ism Us Lie are Ob‏ )2-9 
مترابط) يشرح أعلى قيمة تباين متبقية "مكوّن رئيس Vu‏ ' وهكذا حتى يتم 
شرح كل قيم التباين. من المتغيرات Usa k‏ استخراج المكونات الرئيسة ل 
k‏ والتي يمكنها Cos‏ كل قيم التباين . تحليل المكونات الرئيسة يمكن استخدامه 
U say slats‏ البيانات» GY‏ استخدام مكونات + il‏ سوف يشرح جز ءا كبيرًا 
من التباين» وإذا تم تركيز العمل بشكل أكبر على المكونات» فإنه بالإمكان 
تبسيط التحليل. 
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وعند تطبيق تحليل المكونات الرئيسة على ستة متغيرات توضح 
الكواكب» dax Lil‏ على مكونات رئيسة تشرح التباين بالكامل: 
.pca ringslogdsun-logdense‏ 


Principal components/correlation Number of obs = 9 
Number of comp. = 6 

Trace = 6 

Rotation: (unrotated = principal) Rho = 1.0000 














Component 





Eigenvalue Difference Proportion Cumulative 








4,62365 3.45469 
Comp2 1.16896 1.05664 0.1948 0.9654 
Comp3 .112323 .0539515 0.0187 0.9842 
Comp4 - 0583717 .0217421 0.0097 0.9939 
Comp5 .0366296 .0365651 0.0061 1.0000 


Comp6 .00006454 . 0.0000 1.0000 


Principal components (eigenvectors) 











Variable Compl Comp2 Comp3 Comp4 Comp5 Comp6 | Unexplained 


















rings 0.4554 0.0714 0.2912 0.0351 -0.8370 0.0301 0 
logdsun 0.3121 -0.6576 0.5930 -0.1418 0.3135 -0.0156 0 
lograd 0.4292 0.3455 -0.0390 -0.3216 0.2619 0.7231 0 
logmoons 0.4541 0.0003 -0.1567 0.8466 0.2286 0.0156 0 
logmass 0.3878 0.5037 0.1374 -0.2427 0.2675 -0.6682 0 
logdense -0.3930 0.4352 0.7201 0.3157 0.0932 0.1708 0 






نتائج الأمر pea‏ توضح لنا أن أول مكونين اثنين يشرحان .3 o-‏ من 
6 من التباين التراكمي للستة متغيرات بالكامل. القيم الكامنة المتعلقة 
بالتباين المعياري تم شرحها بواسطة كل مكون. مجموع التباين المعياري 
للمتغيرات الستة بالكامل هو 6. ومن هذا المجموع نرى أن المكون الأول 
Compl‏ يشرح 4.62365 والذي تتم مقارنته مع العدد الكلي للمكوّنات 
5 + 6 - 0.7706 أو حوالي %77 من المجموع الكليء المكوون 
الثاني Comp2‏ يشرح 1.16896 + 6 = 0.1948 أو حوالي 9619 Aala‏ 
تحليل المكونات له قيم كامنة أقل من 1.0 وهذه القيم تشرح أقل من مكافئ 
تباين متغير واحد وهذا لا يساعدنا في اختزال البيانات. محللو البيانات في 
العادة يستبعدون المكونات الثانوية؛ ويركزون على المكونات التي لها نيم 
كامنة تساوي 1 على الأقل. 
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وأفضل طريقة el sy‏ اختزال للبيانات تتم من خلال الأمر Cus factor‏ 
يمكن استخدام العديد من الخيارات مع هذا الأمرء وهي تتعلق بتحليل التحليل 
العاملي للمكونات الرئيسة. وللحصول على عوامل المكونات الرئيسة نقوم 
بطباعة الأمر التالي: 


.factor rings logdsun - logdense, pcf 





(obs=9) 

Factor analysis/correlation Number of obs = 9 
Method: principal-component factors Retained factors = 2 
Rotation: (unrotated) Number of params = 11 

















Factor Eigenvalue Difference Proportion Cumulative 





Factorl 4. 3 0. 0. 

Factor2 1.16896 1.05664 0.1948 0.9654 
Factor3 0.11232 0.05395 0.0187 0.9842 
Factor4 0.05837 0.02174 0.0097 0.9939 
Factor5 0.03663 0.03657 0.0061 1.0000 
Factor6 0.00006 0.0000 1.0000 


LR test: independent vs. saturated: chi2(15) = 100.49 Prob»chi2 = 0.0000 


Factor loadings (pattern matrix) and unique variances 


Factor?  Factor2 















Variable Uniqueness 


rings 0.0353 
logdsun 0.0443 
lograd 0.0088 
logmoons 0.0465 
logmass 0.0082 
logdense 0 


التحليل العاملي للمكونات الرئيسة يبدأ باستخراج المكونات الرئيسة» ثم 
الإبقاء على المكونات التي تفي بمعيار الأهمية وهذا يتم افتراضيآء حيث يتم 
الإبقاء على تلك المكونات التي تكون قيمها الكامنة أكبر من 1. كما رأينا 
سابقاً في مثال pea‏ أن أول مكونين فقط تقابل معيار الأهمية وهذان المكونان 
يشرحان أكثر من 9696 للتباين المشترك للستة متغيرات معاء وبذلك يمكننا 
إهمال بقية المكونات وهي من المكوّن الثالث وحتى المكون السادس. 
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هناك خياران من خيارات الأمر factor‏ يمكنهما التحكم في sac‏ العوامل 
المستخرجة: 
factors(f)‏ حيث إن # تحدد aae‏ العوامل. 
mineigen(f)‏ حيت إن # تحدد JÉ‏ قيمة كامنة للعوامل المحتفظ بها. 
ويما أن التحليل العاملي للمكونات الرئيسة يستبعد بشكل ARS‏ ئي العوامل 
التي تقل قيمها الكامنة عن 1. 
.factor ringslogdsun - 109046256, pcf‏ 
وهذا مكافئ للأمر: 
.factor rings logdsun - logdense, pcf mineigen(1)‏ 
في هذا المثال» يمكننا أن نحصل على نفس النتائج» وذلك من خلال 
طباعة الأمر: 
.factor rings logdsun - logdense, pcf factors(2)‏ 
ولعرض نافذة الرسم البياني (الرسم البياني للقيم الكامنة مقابل عدد 
العوامل أو عدد المكونات) بعد أي أمر factor‏ نقوم باس تخدام الأمر 
«sereeplot‏ في الشكل )1.11( نرى Gad üa‏ عند القيمة الكامنة = 1 صانعاً 
القطع المعتاد للمكونات الرئيسة المحتفظ بهاء ومرة أخرىء فإن هذا القطع 
يؤكد عدم أهمية المكونات من 3 إلى 6. 
.Screeplot, yline(1)‏ 


Scree plot of eigenvalues after factor 


Eigenvalues 








Number 


الشكل )1.11( 
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A cie‏ ا ا a‏ 
التدوير : Rotation‏ 


التدوير يبسط أكثر تركيبة العوامل» فبعد التحليل العاملي قم بطباعة 

الأمر rotate‏ ثم اتبع هذا الأمر بخيار يُحدد نوع التدوير. هناك نوعان 

شائعان للتدوير هما: 

Varimax‏ التدوير المتعامد لأكبر تباين» laii‏ عوامل أو مكونات غير 

مترابطة (هذا هو الوضع الافتراضي). 

Promax()‏ التدوير المائل بروماكس وهذا النوع يسمح بوجود العوامل أو 
المكونات المترابطة» اختر عدد (قوة بروماكس) أقل من أو 
تساوي 4» وكلما زاد هذا العدد كلما كانت درجة الارتباط 
العاملي أقوى» والوضع الافتراضي أن يكون promax(3)‏ 


وللحصول على قائمة كاملة بطرق التدوير والخيارات الأخرى قم 
بطباعة الأمر chelp rotate‏ فعلى سبيل المثال: 
factors()‏ هذا الخيار يحدد عدد العوامل التي يتم حفظها. 
entropy‏ التدويل المتعامد الأقل Laka‏ 


التدوير يمكن القيام به بعد أي تحليل عاملي وليس فقط مع التحليل 
العاملي للمكونات الرئيسة كما سنرى clés‏ هذا الجزء سوف يستخدم الأمثلة 
التي تم اسستخدامها مع الأمر factor‏ والأمر cpet‏ التدوير المتعامد 
(الافتراضي) لأول مكونين تم إيجادهما في بيانات المجموعة الشمسيةء 
وللقيام بعملية التدوير قم بطباعة rotate‏ 


.rotate 
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Factor analysis/correlation Number of obs = 9 
Method: principal-component factors Retained factors = 
Rotation: orthogonal varimax (Kaiser off) Number of params = Ti 












Proportion Cumulative 





Variance Difference 


3.36900 0.94539 0.5615 0.5615 
2.42361 " 0.4039 0.9654 





Factorl 
Factor2 








LR test: independent vs. saturated: chi2(15) - 100.49 Prob»chi2 - 0.0000 


Rotated factor loadings (pattern matrix) and unique variances 


Factorl Factor2 















Variable Uniqueness 


rings .8279 .5285 0. 
logdsun 0.0443 
lograd 0.0088 
logmoons 0.0465 
logmass 0.0082 
0. 


logdense 


Factor rotation matrix 













Factor2 





Factori 





Factorl 
Factor2 


المثال أعلاه يقبل كل الأوضاع الافتراضية: التدوير المتعامد لأعلى 
تباين» ونفس عدد al gall‏ يتم حفظها من آخر أمر tfactor‏ كما يمكننا 
الحصول على نفس النتائج بالضبط من خلال إضافة خيارات إلى الأوامر 
rotate, varimax factors(2)‏ 

el os Y‏ تدوير بروماكس (promax)‏ المائل (يسمح بالعوامل المترابطة) 
لآخر نتائج للتحليل العاملي نقوم بطباعة: 


.rotate, promax 
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Factor analysis/correlation Number of obs 2 
Method: principal-component factors Retained factors = 
Rotation: oblique promax (Kaiser off) Number of params = 11 
a 
Factor Variance Proportion Rotated factors are correlated 














4.7 0.6874 
3.32370 0.5539 


Factorl 
Factor2 





LR test: independent vs. saturated: chi2(15) = 100.49 Prob>chi2 = 0.0000 


Rotated factor loadings (pattern matrix) and unique variances 


Factorl Factor2 















Variable Uniqueness 


rings 0.7626 .3466 9. 
logdsun 0.0443 

lograd 0.0088 
logmoons 0.0465 
logmass 0.0082 
logdense 0. 


Factor rotation matrix 










Factorl Factor2 






0.7898 
-0.6134 


0.9250 
0.3800 


Factorl 
Factor2 









هذا المثال يستخدم بشكل افتراضي قوة بروماكس .3 كما يمكننا تحديد 


قوة بروماكس» وتحديد aac‏ العوامل بالضبط كما يلي: 


.rotate, promax(3) factors(2) 


عند استخدام promax(4)‏ فإن هذا سوف que)‏ بإجراء تبسيط أكثر 


لمصفوفة التشبع» وهذا يؤدي m‏ ارتباط أكثر قوة بين العوامل وأقل Lodi‏ 
للتباين الكلي. 


وبعد إجراء تدوير بروماكس المائل» فإن المتغير أت rings, lograd,‏ 


Jogmoons, logmass‏ سوف يكوا ن الحمل JS‏ 3 على العامل الأول» هذا 
يبدو أنه ذو aaa!‏ أكبر / العديد من الأقمار الصناعية" "large size/many‏ 
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Jall أكثر على‎ jak logdense و المتغير‎ logdsum المتغير‎ «satellites? 
كما أن الأمر‎ «far out/low density" الثاني مما يجعله 'بعيد/ أقل كثافة"‎ 
بإنشاء رسد بياني بعد إجراء التحليل العاملي» وهذا الرسم‎ e si loadingplot 
.)2.11 يساعد في تمثيل هذه النتائج بوضوح (الشكل‎ 
.loadingplot, factors(2) yline(0) xline(0) 


Factor loadings 


9 
logmass 


a e 
logdense lograde 


rings © 


Factor 2 





logdsun 
9 





| 


"0 
Factor 1 
(2.11) الشكل‎ 


Factor Scores : العاملية‎ eal 


ei‏ العاملية هي مكونات خطيّة يتم إنشاؤها بمعايرة كل متغير إلى 
متوسط صفرء وتباين الوحدة ثم وزنها مع مُعَاملات قيم العامل وجمعها لكل 
عامل. الأمر predict‏ يقوم بهذه الحسابات بشكل تلقائي مستخدماً آخر نتائج 
للأمر rotate‏ أو الأمر «factor‏ وعند استخدام الأمر predict‏ فإننا يجب أن 

نقوم بإدراج أسماء المتغيرات الجديدة بعده وهذه الأسماء مثل fl‏ 9 2/. 
.predict f1 f2‏ 
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اګ ————————MM—‏ 
(regression scoring assumed)‏ 


Scoring coefficients (method = regression) 















Variable Factori Factor2 





rings D. 0 
logdsun 0.14513 -0.60818 

lograd 0.19960 0.31958 
logmoons 0.21119 0.00024 
logmass 0.18033 0.46591 
logdense 0. 0.40252 


.label variable f1 "Large size/many satellites" 
.label variable f2 "Far out/low density' 
.list planet f1 2 


planet 
Lm Mercury -.9172388 -1.256881 
2: Venus -.5160229 -1.188757 
3. Earth -,3939372 -1.035242 
4. Mars -.6799535 -.5970106 
Si Jupiter 1.342658 . 5 
6. Saturn 1.184475 .9259058 
Ts Uranus . 7682409 .9347457 
8. Neptune .647119 .8161058 
9. Pluto -1.43534 1.017025 





عند تحويل القيم إلى قيم معيارية» فإن القيم العاملية fl‏ و/رسوف يكون 
لها متوسطات (تقريبا) تساوي صفرء وانحراف معياري يساوي 1. 
.Summarize f1 £2‏ 





Variable Obs Mean Std. Dev. Min Max 
f1 9 -2.31e-09 1 -1.43534 1.342658 
f2 9 9.93e-09 1 -1.256881 1.017025 


ولذلك فإن القيم العاملية يتم قياسها بوحدات انحرافاتها المعيارية عن 
متوسطاتهاء فمثلاً في الجدول ما قبل السابق Mercury 3 lbe SS‏ له انحراف 
معياري قدره 0.92 تقريباً il‏ من المتوسط paa"‏ كبير/ العديد من الأقمار 
الصناعية" )7( لأن هذا الكوكب صغير وليست له أقمار صناعية» عُطارد له 
انحراف معياري Ud‏ من المتوسط 'بعيد flag‏ أقل كثافة" (2) لأنه أقرب للشمس 


504 الإحصاء مع برنامج ستاتا 


وذو كثافة Alle‏ وعلى العكس من cell‏ فإن كوكب Saturn 9s)‏ له انحرافات 
معيارية 1.18 و0.93 أعلى من المتوسط لهذين البُعدين. 
تدوير بروماكس المائل يسمح بالترابط بين القيم العاملية: 


.correlate f1 f2 
(obs=9) 





f1 1.0000 
£2 0.4974 1.0000 


Vlde epa ce. a wie 
وأقل كثافة هي كواكب من المحتمل أن‎ [ise للعامل 2 هذه الكواكب بعيدة‎ 
تكو أكبر حجماً مع العديد من الأقمار الصناعية.‎ 


الأمر الآخر الذي يتم استخدامه لإنشاء رسم بياني بعد إجراء عملية 
التحليل العاملي هو الأمر Cus. scoreplot‏ يقوم برسم شكل الانتشار 
لمشاهدات القيم العاملية» كما يمكن استخدام هذا الأمر مع عوامل المكونات 
الرئيسةء وتساعد هذا الأشكال في تحديد القيم المتطرفة المتعددة أو التحليل 
العنقودي للمشاهدات التي تظهر مختلفة عن البقيةء الشكل )3.11( يوضح 
ثلاثة أنواع مختلفة من الكواكب. 

.Scoreplot, mlabel(planet) yline(0) xline(0) 


Score variables (factor) 








= 4 © Pluto e Donee Saturn 
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2 
E‏ 
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o‏ 
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م‎ 
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Scores for factor 1 


Rotation: oblique promax(3) 
Method; principal-component factors 


الشكل )3.11( 
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الكو اكب الصخرية الداخلية i)‏ غطارد «Mercury‏ انخفاض في 'الحجم 
الكبير / العديد من الأقمار الصناعية" العامل 1» وانخفاض كذلك في "البعيد 
flax‏ منخفض الكثافة" العامل 2) تظهر Lee‏ في الجانب الأسفل الأيسر في 
الشكل cel‏ أما الكواكب العملاقة الغازية فلها خصائص dye Se‏ تماماء 
وتظهر Lea‏ في الجانب الأعلى الأيمن» كوكب بلوتو Pluto‏ الذي يشبه شكله 
بعض الأقمار الخارجية المنتظمة فهذا الكوكب فريد من نوعه مقارنة بالتسعة 
أقمار التقليديةء GY‏ بُعده 'بعيد جداً/ أقل كثافة" وفي نفس الوقت فهو منخفض 
في ass‏ "الحجم الأكبر/ € من الأقمار الصناعية"» ل ذلك فإن التحليل 
العاملي قام بتصنيف كوكب بلوتو كنوع آخر من الأنواع التي لا تتناسب مع 
المجموعتين الرئيستين من الكواكب» وبالأخذ في الاعتبار الطبيعة الخاصة 
لكوكب بلوتوء فإن الاتحاد الفلكي العالمي قام في 2006 بإعادة تصنيف 
كوكب بلوتو من كونه أحد الكواكب الرئيسة إلى واحد من الكواكب التي 
pies‏ "الكو اكب موسو ب NU‏ 


العاملية غير المترابطة تكون: 
-quietly factor rings logdsun - logdense, pcf‏ 
.quietly rotate‏ 


.quietly predict varimax1 varimax2 
¿correlate varimaxi1 varimax2 


(obs=9) 


varimaxl varimax2 





varimaxl 1.0000 
varimax2 0.0000 1.0000 


عند إنشاء القيم العاملية باستخدام الأمر predict‏ فإن هذه القيم يمكن 
معاملتها مثل أي متغير من متغيرات ستاتا وإدراجها في أي أمرء وتحليل 
ارتباطها وتمثيلها بيانياً وهكذاء القيم العاملية في العادة تستخدم في العلوم 
الاجتماعية والسلوكية وذلك لتوحيد العديد من الاختبارات أو عناصرٍ 
استمارات الاستبيان في متغيرات مركبة أو مؤشرات» كما سيتم شرحه لاحقا 
في هذا الفصل. أما في مجال العلوم التطبيقية مثل علوم المناخ أو الاستشعار 
عن بُعدء فإن all‏ العاملية التي يتم الحصول عليها بواسطة تحليل المكونات 
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الرئيسة بدون تدوير تساعد في تحليل حجم كبير من البيانات» في هذه 
التطبيقات فلن تحليل المكونات Gib;‏ عليه "الدوال المتعامدة Í cans yall‏ ول 
Alla‏ متعامدة تجريبية — EOFI Li J‏ - تساوي قيمة عاملية لأول 


CS‏ رئيس ا 2 هي قيمة المكون الرئيس الثاني وهكذا. 
التحليل العاملى الرئيس : Principal Factoring‏ 
الأمثلة أعلاه تضمنت تحليل المكونات الرئيسة وتم استخدام الأمر factor‏ 

مع الخيار Ul epet‏ الخيارات الأخرى للأمر factor‏ فتقوم بالتحليل العاملي 
بطرق مختلفة. 

pef‏ تحليل المكونات الرئيسة. 

pf‏ التحليل العاملي الرئيس (وهو الوضع الافتراضي). 

iterated التحليل العاملي للمكونات مع قيم الشيوع المتكررة‎ ipf 

-communalities 

ml‏ التحليل العاملي بطريقة is‏ جحية العظمى. 
ارتباط Ales‏ والتي فيها uas ctt E‏ 
من cl‏ خيارات الأمر factor‏ وهي ipf 5 pf‏ تقوم بحساب التحليل العاملي 
الرئيس» وهي تختلف في كيفية تقدير قيم الشيوع: 

d$ انحدار كل متغير على‎ cw R تقديرات قيم الشيوع تساوي‎ pf 

المتغيرات الأخرى. 
ipf‏ التقديرات التكرارية لقيم الشيوع. 
وتجدر الإشارة isl‏ أن تحليل المكونات الرئيسة يركز على شرح تباين 

المتغيرات؛ إلا أن التحليل العاملي الرئيس يشرح الارتباط بين المتغيرات» 
سوف نقوم بتطبيق التحليل العاملي الرئيس مع قيم الشيوع المتكررة (pf)‏ 
على البيانات الخاصة بالكواكب: 


.factor rings logdsun - logdense, ipf 
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(obs=9) 

Factor analysis/correlation Number of obs = 9 
Method: iterated principal factors Retained factors = 5 
Rotation: (unrotated) Number of params = 15 


Beware: solution is a Heywood case 
(i.e., invalid or boundary values of uniqueness) 











Factor Eigenvalue Difference Prcportion Cumulative 
















Factorl 4.59663 3.46817 0. 

Factor2 1.12846 1.05107 0.1940 0.9843 
Factor3 0.07739 0.06438 0.0133 0.9976 
Factor4 0.01301 0.01176 0.0022 0.9998 
Factor5 0.00125 0.00137 0.0002 1.0000 
Factor6 -0.00012 5 -0.0000 1.0000 


LR test: independent vs. saturated: chi2(15) = 100.49 Prob»chi2 = 0.0000 


Factor loadings (pattern matrix) and unique variances 

















Variable Factorl Factor2  Factor3  Factor4  Factor5 





Uniqueness 





















rings 0.9760 0.0665 -0.0223 0.0292 
logdsun 0.6571 -0.6705 0.1411 0.0447 0.0082 0.0966 
lograd 0.9267 0.3700 -0.0450 0.0486 0.0166 -0.0004 
logmoons 0.9674 -0.0107 0.0078 -0.0859 0.0160 0.0564 
logmass 0.8378 0.5458 0.0056 0.0282 -0.0071 -0.0007 
logdense -0.8460 0.4894 0.2059 -0.0061 0.0100 0.0022 









Variable Uniqueness 
rings 0.0292 
logdsun 0.0966 
lograd -0.0004 
logmoons 0.0564 
logmass -0.0007 
logdense 0.0022 


في الجدول odef‏ برنامج ستاتا يعرض تحذير 'تحذير: dall‏ عبارة عن 
حالة 35535" “Beware: solution is a Heywood case.”‏ وعند النقر على الرابط 
Heywood case‏ في التحذير سوف يتم عرض شرح للمشكلة الموجودة في هذا 
call‏ وهذا يعكس صغر حجم العينة الاستثنائي )9 = (n‏ وللتبسيط سوف 
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نستمر في التحليل» ولكن عند إجراء أي بحث» فإن مثل هذا النوع من 
التحذيرات يجب أن يعتبر تنبيهاً لنا لإعادة النظر في الطريقة التي نستخدمها. 

نرى أن هناك عاملين فقط لهما قيم كامفة أكشر من 1ء باس تخدام 
الخيارات pef‏ وم Lise:‏ تجاهل العوامل البسيطة» وعند استخدام الخيار ipf‏ 
فإنه يجب Lule‏ تحديد كم عدد العوامل التي نريد حفظهاء ثم نكرر التحليل مع 
هذا العدد من cel gall‏ الآن سوف نقوم بحفظ عاملين اثنين: 


ipf factor(2) 


Number of obs 
Retained factors 
Number of params 


M" 
دم‎ wo 


11 











Proportion Cumulative 





Difference 










.factor rings logdsun - logdense, 


(obs=9) 


Factor analysis/correlation 
Method: iterated principal factors 


Rotation: (unrotated) 


Beware: solution is a Heywood case 
(i.e., invalid or boyndary values of uniqueness) 





Factor Eigenvalue 





Factorl 4 3.47412 0 0 
Factor2 1.10083 1.07631 0.1940 1.0000 
Factor3 0.02452 0.02013 0.0043 1.0043 
Factor4 0.00439 0.00795 0.0008 1.0051 
Factor5 -0.00356 0.02182 -0.0006 1.0045 
Factor6 1 


100.49 Prob»chi2 - 0.0000 


chi2(15) = 





LR test: independent vs. saturated: 


Factor loadings (pattern matrix) and unique variances 














Uniqueness 


0.1202 
0.0086 
0.0614 
-0.0089 


Variable 


rings 
logdsun 
lograd 
logmoons 
logmass 
logdense 
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بعد إجراء تحليل العوامل مع الخيار cipt‏ يمكننا إنشاء متغيرات مركبة 
باستخدام الأمر rotate‏ والأمر predict‏ بنفس الطريقة التي قمنا بها ia‏ 
وبسبب مشكلة حالة هيوود Heywood-case‏ فإن القيم العاملية هنا أقل y ss‏ من 
نتائج pef‏ التي تحصلنا عليها cia‏ وكاستراتيجية للبحث» فإنه من المفيد 
تكرار التحليل العاملي باستخدام طرق مختلفة حتى نحصل على نتائج أكشر 


5 


قبولا. 
duisi‏ العاملى بطريقة الأرجحية العظمى : 
Maximum-Likelihood Factoring‏ 
التحليل العاملي بطريقة الأرجحية العظمى — يختلف عن خيارات الأمر 
factor‏ — يعتبر وسيلة لإجراء اختبارات لفرضيات» وهذه الاختبارات تساعد 
في تحديد aam‏ مناسب من al gall‏ وللحصول على عامل inaj‏ عظمى 
واحد لبيانات الكواكب نقوم بطباعة الأمر التالي: 


-factor rings logdsun -  logdense, ml nolog 








factor(1) 

(obs=9) 

Factor analysis/correlation Number of obs = 9 
Method: maximum likelihood Retained factors - 1 
Rotation: (unrotated) Number of params - 6 

Schwarz's BIC - 97.8244 
Log likelihood - -42.32054 (Akaike's) AIC = 96.6411 









Factor Eigenvalue Difference Proportion Cumulative 











Factorl 4.47258 1.0000 
100.49 Prob»chi2 0.0000 


51.73 Prob»chi2 - 0.0000 


LR test: independent vs. saturated: chi2(15) 
LR test: 1 factor vs. saturated: chi2(9) 


Factor loadings (pattern matrix) and unique variances 














Variable Uniqueness 


rings 0.0254 
logdsun 0.6493 
lograd 0.1229 
logmoons 0.0805 
logmass 0.2445 
logdense 0. 
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مخرجات الخيار ml‏ تحتوي على اختبارين 2, لمعدل الاحتمال: 


اختبار 


اختبار 


LR‏ الاستقلالية مقابل التشبع 


وهو يختبر ما إذا كان نموذج ما بدون عامل (مستقل) يتناسب مع 
مصفوفة الارتباط المشاهدة بدرجة أسوأ بكثير من نموذج متشبع 
أو نموذج متناسب بشكل كاملء الاحتمال المنخفض Lia)‏ 0.0000 
وهذا يعني 0.00005 (p<‏ يشير إلى أن Lad gai‏ بدون عامل سوف 
يكون as Usos‏ 

ILR‏ معامل 1 مقابل التشبع 


وهو يختبر ما إذا كان نموذج العامل الواحد الحالي يتناسب بدرجة 
أسوأ بكثير من نموذج متشبعء قيمة م المنخفضة هنا تشير إلى 
عامل واحد سوف يكون بسيطا جدا. 


بالطبع» فإن نموذج عاملين سوف يكون أفضل: 


.factor rings 1096085112 - logdense, ml nolog 


factor(2) 

Cobs=9) 

Factor analysis/correlation Number of obs = 9 
Method: maximum likelihood Retained factors = 2 
Rotation: (unrotated) Number of params = TI 

Schwarz's BIC - 36.6881 
Log likelihood - -6.259338 (Akaike's) AIC = 34.5187 
Beware: solution is a Heywood case 
(i.e., invalid or boundary values of uniqueness) 

Factor Eigenvalue Difference Proportion Cumulative 
Factorl 3.64200 1.67115 0.6489 0.6489 
Factor2 1.97085 . 0.3511 1.0000 

LR test: independent vs. saturated: chi2(15) = 100.49 Prob>chi2 = 0.0000 
LR test: 2 factors vs. saturated: chi2(4) = 6.72 Prob>chi2 = 0.1513 


(tests formally not valid because a Heywood case was encountered) 


Factor loadings (pattern matrix) and unique variances 


Variable Factorl Factor2 Uniqueness 
rings 0.8655 -0.4154 0.0783 
logdsun 0.2092 -0.8559 0.2236 
lograd 0.9844 -0.1753 0.0003 
logmoons 0.8156 -0.4998 0.0850 
logmass 0.9997 0.0264 0.0000 
0.4643 0.8857 0.0000 





logdense - 
ee 
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الآن نحن وجدنا ما يلي: 
اختبار :LR‏ الاستقلال مقابل التشبع 

أول اختبار لم يتغيرء حيث إنه نموذج بدون عامل بسيط جداً. 
اختبار LR‏ عاملان مقابل التشبع 

نموذج عاملين ليس سيئاً بدرجة كبيرة )0.1513 = (p‏ من نموذج 

يتناسب بشكل كامل. 


هذه الاختبارات ous iic‏ الى أ ن عاملين Cal‏ يسمحان بإنشاء نموذج 


الطرق المتبعة في حساب التحليل العاملي بطريقة الأرجحية العظمى في 
العادة تؤدي إلى إيجاد حلول لمشكلة هيود أو إظهار نتائج غير Logis‏ 
تباين سالب أو تفردية تساوي 0( وعند حدوث ذلك LS)‏ في نموذج عاملين 
ml‏ في المثال أعلاه) فإن اختبارات ‏ تفتفر إلى مبررات واضحة»ء وعند 
مشاهدة وصف لهذه الاختبارات فإنه بالإمكان تحديد دليل واضح بخصوص 
العدد المناسب للعوامل. 
التحليل العنقودي — 1 : 1 — Cluster Analysis‏ 


التحليل العنقودي يشمل عدذا كبيرًا من الطرق التي تصنف المشاهدات 
gi‏ مجموعات أو عناقيد Ss‏ على الاختلافات في أعداد متغيراتهاء » وفي 
أغلب الأحيان فإن التحليل العنقودي spits‏ متمخلا alae‏ لتظوير تضكيف 
عملي بدلاً من اختبار فرضيات محددة مسبقا. وفي الحقيقة ليست هناك 
نظرية واضحة تحدد اختبار الفرضيات في طرق التحليل العنقودي الشائعةء 
axe Ul‏ الخيارات il sill‏ في كل خطرة في التحليل يمن وض Lebi li‏ 
GY ide‏ هذه الخطوات من الممكن أن تقودنا إلى نتائج مختلفة» هذا sjal‏ 
يُعتبر نقطة بداية عن التحليل العنقودي. وسوف نتناول بعض الأفكار 
الأساسية ونشرحها باستخدام بعض الأمثلة البسيطة:؛ دليل المستخدم 
Multivariate Statistics Reference Manual‏ يوضح الخيارات الكاملة المتوافرة 
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في هذا الصددء كما أن دراسة Everitt et a.‏ )2001( تغطي هذه المواضيع 
بتفاصيل أكثرء وتتضمن مقارنات بين العديد من طرق التحليل العنقودي. 

كل طرق التحليل العنقودي تبدأ ببعض التعريفات عن أوجه اختلافها 
وتشابههاء فمقاييس الاختلافات تعكس المسافة بين مشاهدتين أو مجموعة 
محددة من المتغيرات. وبصفة عامة مثل هذه المقاييس يتم تصميمها حتى نجد 
oe‏ الاختلاف بين مشاهدتين متماثلتين يساوي صفرا وأقصى اختلاف 
للمشاهدات المختلفة يساوي cL‏ أما مقاييس التشابه فهي تعكس هذا القياس» 
ولذا فإن المشاهدات المتمائلة لها تشابه يساوي 1؛ خيارات الأمر cluster‏ 
ببرنامج ستاتا تعطينا عددًا من الخيارات لقياس التشابه والاختلاف. ولتسهيل 
عملية حساب ذلك» فإن برنامج ستاتا يقوم داخليا بتحويل التشابه إلى اختلاف 
يتم حسابه كما يلي: 

الاختلاف = 1 - التشابه 


مقياس الاختلاف الافتراضي ببرنامج ستاتا للربط المتوسطء والربط 
الشامل» والربط المنفرد» والربط المتردد هو مسافة إقليدس التي يقوم بحسابها 
الخيار measure(L2)‏ فهذا الخيار يحسب المسافة بين المشاهدة : والمشاهدة j‏ 
كما يلي: 
xy) } is‏ 6ق 

Cus.‏ إن xy,‏ تمثل قيمة المتغير x,‏ للمشاهدة xy oi‏ قيمة المتغير x,‏ للمشاهدة 
j‏ والمجموع يكون لكل متغيرات + التي تم إدخالهاء الخيارات الأخرى 
المتوافرة لقياس الاختلاف (dis)‏ بين المشاهدات التي تعتمد على المتغيرات 
المستمرة نتضمن مسافة إقليدس التربيعية the squared Euclidean distance‏ 
L2squared)‏ هو الأمر الافتراضي للارتباط المركزي» والارتباط الوسيط 
وارتباط الأجزاء) ومسافة القيمة. المطلقة (L1)‏ ومسافة أعلى قيمة (Linfinity)‏ 
وقياس تشابه معامل الارتباط Lal (correlation)‏ الخيارات المتوافرة للمتغيرات 
الثنائية تتضمن deel ye‏ بسيطة (matching)‏ ومُعامل التشابه الثنائي لجاكارد 
Jaccard(Jaccard)‏ ومُعاملات أخر Lal oe‏ الخيار gower‏ يعمل مع متغيرات 
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ثنائية ومستمرة مختلفة. وللحصول على قائمة كاملة» وشرح dai‏ عن 
خيارات قياس الاختلافات قم بطباعة الأمر -help measure option‏ 

طرق التحليل العنقودي يمكن تصنيفها تحت فئتين هما: جزئي وهرمي» 
الطرق الجزئية تقوم بتقسيم المشاهدات في أعداد مقسّمة مسبقا لمجموعات 
غير متداخلة» ولدينا طريقتان للقيام بذلك: 

متوسطات k‏ العنقودية :Cluster kmeans‏ التحليل العنقودي لمتوسطات 
k‏ حيث يقوم المستخدم بتحديد axe‏ العناقيد cla sti J yall O‏ ثم يقوم ستاتا 
بعد ذلك بإيجاد هذه العناقيد من خلال إجراء بديل» ويقوم بتقييم المشاهدات 
التي تقع إلى أقرب متوسط. 

وسيط k‏ العنقودي :Cluster kmedians‏ التحليل العنقودي لقيم الوسيط ck‏ 
lia y‏ التطيل duty‏ التطليل العنقودي لمتوسطات c‏ ولكن هذا لالتطيل يسم 

طرق التجزئة يبدو أنها أبسط وأسرع حسابياً من الطرق الهرمية: 
وضرورة تحديد عدد العناقيد Letts de‏ عقيو أحد عيوب العمل 


الطرق الهرمية تتضمن عملية تحويل المجموعات الصغيرة إلى 
مجموعات أكبر بطريقة تدريجية. برنامج ستاتا يستخدم طريقة التكتل 
agglomerative‏ في التحليل العنقودي الهرمي وهذه الطريقة تبدأ معكل 
مشاهدة ويتم اعتبار كل مشاهدة كمجموعة منفصلة» أقرب مجموعتين يتم 
دمجهما وتستمر هذه العملية حتى التوقف في نقطة معينة أو حتى يتم وضع 
كل المشاهدات في مجموعة واحدة» ويتم عرض نتائج التحليل العنقودي 
الهرمي في OSA‏ بياني شجري يسمى dendrogram‏ أو شكل شجري» هناك 
عدة خيارات متاحة لطرق الربطء والتي تحدد ما الذي يجب أن تتم مقارنته 
بين المجموعات التي تحتوي على أكثر من مشاهدة: 

الربط الفردي العنقودي :eluster singlelinkage‏ التحليل العنقودي للرابط 
capial‏ يقوم بحساب الاختلاف بين زوج من المشاهدات الأقل اختلافاً في 
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مجموعتين» وبالرغم من سهولة هذه الطريقةء فإن مقاومتها أقل للقيم 
المتطرفة أو أخطاء القياس. والمشاهدات تميل للانضمام للتحليل العنقودي 
مرة واحدة» وهذا يؤدي إلى إنشاء مجموعات طويلة أو غير متوازنةء» وتكون 
مكونات هذه المجموعات غير متجانسة؛ ولكنها ثربط مع بعضها بواسطة 
مشاهدات وسطية» وهذه المشكلة تسمى التسلسل. 

الربط المتوسط العنقودي cluster averagelinkage‏ التحليل العنقودي 
للرابط (dau giall‏ يستخدم هذا التحليل لتحليل الاختلاف المتوسط للمشاهدات 
في مجموعتين مؤدياً إلى ظهور خصائص متوسطة بين الربط الكلي 
complete linkage‏ والربط المفرد «single linkage‏ دراسات المحاكاة وجدت 
ob‏ الربط المتوسط يعمل بشكل جيد في العديد من الحالات»ء وهذا الربط 
موثوق بدرجة معقولة (انظر دراسة Everitt et al.‏ 2001 والمصادر الني 
ذكرتها الدراسة في المراجع)؛ وهذا النوع من الربط يُستخدم بشكل كبير في 
ale‏ الآثار. 

الربط الشامل العنقود ي :cluster completelinkage‏ التحليل العنقودي 
للربط الشامل؛ وهذا التحليل يستخدم زوج المشاهدات الأقل تشابهاً في 
n fepe‏ لوط ail doas. Od‏ النتطرقة sey ca adi dap Jl i‏ 
في الاتجاه المعاكس نحو تجميع العديد من المشاهدات في عناقيد مدمجة 
Aus Aes‏ 

الربط المتردد العنقو دي :cluster waveragelinkage‏ التحليل العنقودي 
للربط المتردد الموزون. 

الربط الوسيط العنقودي ‘cluster medianlinkage‏ التحليل العنقودي 
dada‏ 


الربط المتوسط الموزون» والربط الوسيط هي تباينات في الربط 
المتوسط والربط المركزي على التوالي» وفي الحالتين فإن الاختلاف في 
كيفية التعامل مع مجموعتين مختلفتين في الحجم عند دمجهماء ففي الربط 
المركزي والربط المتوسط عدد العناصر لكل مجموعة تؤخذ في الاعتبار 
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عند الاحتساب معطياً في المقابل التأثير الأكبر للمجموعة الأكبر GY)‏ كل 
مشاهدة لها نفس الوزن)؛ وفي الربط الوسيط والربط المتوسط الموزون» فإن 
المجموعتين يتم إعطاؤهما أوزانا متساوية بغض النظر عن كيفية وجود 
العديد من المشاهدات في كل مجموعة. الربط الوسيط يشبه الربط المركزي»› 
حيث إن كلا الرابطين لهما فترات ثقة. 

الربط المركزي العنقودي ‘cluster centroidlinkage‏ التحليل العنقودي 
للربط المركزيء وهذا النوع من التحليل يدمج المجموعات ذات المتوسطات 
المتقاربة (بعكس الربط المتوسط والذي يعتني بالمسافة المتوسطة بين 
palic‏ مجموعتين)» هذه الطريقة لها نقاط فترات ثقة حيث الدمج يبدأ عند 
مستوى أقل للاختلاف من الدمج السابق؛ الانعكاسات تشير إلى عدم استقرار 
تركيبة التحليل العنقودي» وصعوبة التفسير» ولايمكن تمثيله بيانيا بواسطة 
الأمر .cluster dendrogram‏ 

ربط الأجنحة العنقودية cluster wardslinkage‏ التحليل العنقودي لرابط 
الأجنحةء حيث يقوم بتجميع مجموعتين معاً تؤديان إلى Ud‏ زيادة في خطأ 
مجموع المربعات» ويتناسب هذا التحليل بشكل كبير مع المجموعات التي لها 
توزيع طبيعي متعدد المتغيرات» وذات أحجام متشابهةء ولا يتناسب هذا 
التحليل مع المجموعات التي تكون أعداد مشاهداتها في العناقيد أو 
المجموعات غير متشاوية. 

سابقاً في هذا الفصلء رأينا أن التحليل العاملي للمكونات الرئيسة للبيانات 
الموجودة بالملف planets.dta‏ (الشكل 3.11( aá‏ بتحديد ثلاثة أنواع من الكواكب: 
كواكب صخرية داخلية» كواكب عملاقة غازيةء وكوكب بلوتو في فئة خاصة به 
وحده؛ التحليل العنقودي يعتبر طريقة بديلة للسؤال عن نوع الكوكب» وحيث إن 
المتغيرات مثل عدد الأقمار (moons)‏ وتكتلها في الكيلوجرامات (mass)‏ يتم قياسه 
بوحدات قياس غير متشابهة مع اختلاف كبير جداً في التباين» لذلك يجب علينا 
إجراء نوع من القياس المعياري بطريقة ما لتفادي الحصول على نتائج متأثرة 
بالتباين الكبير لبعض العناصرء الخيار الأكثر شيوعاً للقيام بذلك - بالرغم من أنه 
ليس ILS‏ تلقائياً - هو وضع متوسط معياري يساوي صفرًا واستخدام وحدة 
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للانحراف المعياري» يمكن القيام ally‏ عن طريق الأمر egen‏ (واس تخدام 
متغيرات في شكل لوغاريتمي لنفس الأسباب التي تم مناقشتها سابقا)» الأمر 
J$5: summarize‏ أن المتغيرات الجديدة z‏ لها متوسطات تساوي صفرًا Li‏ 
وانحرافات معيارية تساوي واحد. 


.egen zrings = std(rings) 
.egen zlogdsun = std(logdsun) 
.egen zlograd - std(lograd) 
.egen zlogmoon - std(logmoons) 
.egen zlogmass - std(logmass) 


.egen zlogdens std(logdense) 
.summ z* 
Variable Obs Mean Std. Dev. Min Max 









zrings 9 -1.99e-08 1 -.8432741 1.054093 
zlogdsun 9 -1.16e-08 i €1,.393821 1.288216 
zlograd 9 -3.31e-09 1 -1.3471 1.372751 
zlogmoon 9 0 1 -1.207296 1.175849 
zlogmass 9 -4.14e-09 1 -1.74466 1.365167 







.128901 


m 


zlogdens -1.32e-08 1 -1.453143 


نتيجة التحليل العاملي للمكونات الرئيسة للأنواع ADU‏ هي نتيجة 
موثوقة» كما يمكن الحصول على نفس النتيجة من خلال التحليل العنقودي. 
فعلى سبيل المثال» يمكننا إجراء تحليل عنقودي هرمي مع متوسط الرابط 
باستخدام مسافة إقليدس Euclidean distance(L2)‏ كمقياس للاختلاف. الخيار 
name(L2age)‏ يعطي Gul‏ للنتائج التي نحصل عليها من هذا التحليل حتى 
يمكننا الإشارة إلى هذه النتائج في الأوامر اللاحقة» خاصية إعطاء أسماء 
للنتائج هي شيء مفيد عندما نحتاج إلى إجراء sac‏ ين غمليات Gast)‏ 
العنقودي ومقارنتها مع المخرجات. 
.Cluster averagelinkage zrings zlogdsun zlograd‏ 


zlogmoon zlogmass 
zlogdens, measure (L2) name (L2avg) 


لم يحدث أي شيء بالرغم من أننا قد لاحظنا أن البيانات الآن تحتوي 
على ثلاثة متغيرات bana‏ مع أسماء تم إنشاؤها بناءً على المتغير Lag‏ 
هذه المتغيرات الجديدة L2avg*‏ ليست مهمة بشكل مباشر ولكن يمكن 
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استخدامها بشكل غير مباشر بواسطة الأمر cluster dendrogram..‏ لرسم 
شجرة التحليل العنقودي أو الشكل الشجري الذي يعرض نتائج أحدث تحليل 
عنقودي هرمي (الشكل 4.11(« الخيار label(planet)‏ يؤدي إلى إظهار aud‏ 
الكواكب (قيم المتغير (planet‏ كتوصيفات aul‏ الرسم البياني. 


¿Cluster dendrogram, label (planet) ylabel(0(1)5) 


Dendrogram for L2avg cluster analysis 


2 3 4 5 
zi NT E 


L2 dissimilarity measure 


1 
i 





od 
Mercury Venus Earth Mars Pluto Jupiter Saturn Uranus Neptune 


الشكل )4.11( 


الشكل الشجري )4.11( يعتبر أداة تفسيرية رئيسة للتحليل العنقودي 
الهرمي» ويمكننا تتبع العملية المتجمعة من كل مشاهدة ومقارنة نتيجتها 
العنقودية المتميزة - التي تظهر في أسفل الشكل - مع كل النتائج المدمجة 
في عنقود واحد في الأعلى؛ > كوكب فينوس Venus‏ وكوكب الأرض Earth‏ من 
Asal‏ وكذلك LSS‏ أورانوس Uranus‏ ونيبتون Neptune‏ من «og Al Asal‏ 
الأقل اختلافاً أو أكثر الأزواج delis‏ حيث تم تجميعها أولاً وكونوا أول 
عنقودين من مشاهدات متعددة في مستوى (الاختلاف) أقل من 1ء « 98 US‏ 
جوبتير Jupiter‏ وزحل Saturn‏ ثم الأرض Earth‏ — فينوس Venus‏ والمريخ 
aà Mars‏ فينوس YI — Venus‏ ض Earth‏ — المريخ Mars‏ وعطارد Mercury‏ 
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als‏ \ المشتري Jupiter‏ — زجحل Uranus "Tm Saturn‏ — نيبتون 
Neptune‏ تم تجميعها في سلسلة سريعة وجميعها لها اختلافات ]3-88 من 1 
«alas‏ عند هذه النقطة لدينا نفس الثلاث مجموعات التي أظهرها تحليل 
المكونات الرئيسة في الشكل (3.11): الكواكب الصخرية الداخلية والكواكب 
العملاقة الغازية وبلوتو الثلاثة عناقيد تبقى مستقرة حتى الوصول الس 
مستوى أعلى من الاختلاف (أعلى من 3( بلوتو تم دمجه ضمن مجموعة 
الكواكب الصخرية الداخليةء وعند الوصول إلى درجة اختلاف أعلى من 4 

فسوف يندمج آخر عنقودين. 

ol‏ كم نوعاً من الكواكب لدينا؟ الشكل )4.11( يعطي الإجابة يوضوح 
وهي "الإجابة التي تعتمد على" كم درجة الاختلاف التي نريد القبول بها لكل 
نوع؟ الخطوط العمودية الطويلة بين مرحلة العناقيد الثلاثة ومرحلة العنقودين 
في أعلى جزء من الرسم البياني تشير إلى وجود ثلاثة أنواع يمكن التمييز 
بينها بوضوح» ويمكننا إنقاص هذه الأنواع الثلاثة إلى نوعين فقط وذلك بدمج 
مشاهدة (بلوتو (Pluto‏ لأنه مختلف عن البقية في مجموعته؛ ويمكننا التوسع 
ليكون لدينا خمسة أنواع فقط؛ وذلك من خلال توضيح الفرق بين عدد من 
(ule) cas SII‏ سبيل المثال» عطارد وفينوس Venus‏ — الأرض Earth‏ — 
المريخ (Mars‏ والتي لاتختلف كثيراً بحسب معايير المجموعة الشمسيةء ولذا 
فإن الشكل الشجري يدعم الشكل الذي يحتوي على ثلاثة أنواع. 

الأمر cluster generate‏ يقوم بإنشاء متغير جديد يشير إلى النوع أو 
المجموعة التي تنتمي إليها كل مشاهدة. في هذا المشال group(3)‏ يتطلب 
ثلاث مجموعات» الخيار name(L2avg)‏ يقوم بتحديد نتائج معينة ونقوم 
بإعطائها اسم -L2avg‏ هذا الخيار هو أكثر الخيارات فائدة عندما gaai‏ 
الحسابات NM Sols‏ متعددًا. 
.Cluster generate plantype- groups (3),‏ 

name (L2avg) 


.label variable plantype "Planet type' 
.list planet plantype -— 
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planet plantype 


Mercury 
Venus 
Earth 

Mars 


Uo س‎ ON (| 


Jupiter 


Saturn 
Uranus 
Neptune 
Pluto 


o‏ كك همه فض 





الكواكب الصخرية الداخلية تم ترميزها لتكون 1 = ممرؤسعامء والكواكب 
العملاقة الغازية 3 = «plantype‏ وكوكب بلوتو وحده 2 = splantype‏ ترميز 
المجموعات تكون 3ء 1:2 من اليسار إلى اليمين مرتباً بحيث تكون العناقيد 
النهائية في الشكل البياني الشجري (الشكل 4.11(« aic y‏ القيام بحفظ البيانات 
فإن الرموز يمكن استخدامها كمتغير تصنيفي آخر في أي تحليلات لاحقة. 

بيانات الكواكب لها نمط طبيعي قوي وهذا هو السبب وراء حصولنا 
على نتائج متشابهة من استخدام تقنيات تحليل مختلفة مثل تحليل المكونات 
الرئيسة» والتحليل العنقودي. يمكننا اختيار طرق أخرى لقياس الاختلاف 
وطرق ربط أخرى لهذا المثال» وسوف نصل إلى نفس النتيجة تقريباً. ومن 
ناحية أخرىء فإن البيانات النمطية الضعيفة أو المعقدة في العادة تظهر نتائج 
مختلفة بناءً على طريقة التحليل المستخدمة. العناقيد التي تنتج من طريقة 
تحليل واحدة قد لا تكون دليلا على إمكانية تكرار نفس النتائج مع طرق 
أخرى أو مع قرارات تحليلية مختلفة قليلا. 
التحليل Cluster Analysis — 2 : 2 — @sqaisl\‏ 

اكتشاف تصنيف موثوق وبسيط لتوصيف الكواكب التسعة كان واضحاًء 
ولعرض أمثلة ASÍ‏ صعوبة:» فإننا سوف نستخدام بيانات الدول الموجودة 
بالملف «Nations2.dta‏ متغيرات التنمية البشرية للأمم المتحدة يمكن تطويرها 
لتكون تصنيفاً عملياً للدول. 


.use C:\data\Nations2.dta, clear 
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.describe 
Contains data from C:\data\Nations2.dta 
obs: 194 UN Human Development Indicators 
vars: 13 2 Jul 2012 1 
size: 12,804 








storage display value 


variable name type format label variable label 

M 

country str21 $21s Country 

region byte 9 region Region 

gdp float %9.0g Gross domestic product per cap 2005$, 2006/2009 

school float %9.0g Mean years schooling (adults) 2005/2010 

adfert float %8.0g Adolescent fertility: births/1000 fem 15-19, 
2010 

chldmort float %9.0g Prob dying before age 5/1000 live births 
2005/2009 

life float $9.0g Life expectancy at birth 2005/2010 

pop float %9.0g Population 2005/2010 

urban float %9.0g Percent population urban 2005/2010 

femlab float %9.0g Female/male ratio in labor force 2005/2009 

literacy float 09 Adult literacy rate 2005/2009 

602 float %9.0g Tons of CO2 emitted per cap 2005/2006 

gini float 09 Gini coef income inequality 2005/2009 





Sorted by: region country 


بالعمل مع نفس البيانات في الفصل )7( رأينا تحويلات غير خطيّة مثل 
اللوغاريتمات التي ساعدت في جعل التوزيعات أكثر طبيعية وجعل العلاقات 
خطيّة أكثر بين بعض المتغيرات» نفس الطرق للتحويلات غير الخطية يمكن 
تطبيقها في التحليل العنقودي؛ ولكن deal‏ المثال أكثر بساطة فلن نقوم 
باستخدام هذه الطرق هنا. التحويلات الخطية التي تجعل المتغيرات أكشر 
معيارية مازالت ضرورية هناء وإذا لم نقم بذلك فإن المتغير gdp‏ والذي 
يتراوح من حوالي 280 دولارًا إلى 74,906 دولارات (بانحراف معياري 
2 دولارًا) فإن ذلك قد يؤدي إلى التغلب على المتغيرات الأخرى مثل 
life‏ والذي يتراوح بين 46 تقريباً إلى 83 سنة (بانحراف معياري 10 
سنوات). في الجزء السابق قمنا بتحويل بيانات الكواكب لتكون بيانات 
معيارية من خلال طرح متوسط كل متغير ثم قسمته على انحرافه المعياري 
حتى تكون US‏ نتائج z‏ لها انحرافات معيارية تساوي 1. في هذا الجزء سوف 
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UNE RN‏ و و ECTS‏ 
نقوم باتباع طريقة مختلفة تسمى مدى المعايرة» والتي تعمل بشكل Me‏ مع 
التحليل المتقودي, 
مدى المعايرة يتضمن Laud‏ كل متغير على مداه» ليس هناك أمر 
ببرنامج ستاتا يقوم بذلك بطريقة مباشرة ولكن يمكننا إنشاء jal‏ للقيام «dis,‏ 
وللقيام بذلك سوف نستخدم النتائج التي قام برنامج ستاتا بحفظها في ذاكرته 
العاملة بعد الأمر summarize‏ وذلك بطباعة «return list yl‏ (بعد alke‏ 
أوامر النماذج مثل regress‏ أو factor‏ وبدلاً من ذلك قم باس تخدام الأمر 
.(ereturn list‏ في هذا المثال سوف نلقي نظرة على النتائج المخزنة بعد 
الأمر summarize pop‏ ثم استخدام أعلى وأقل قيم (المخزنة كأعداد قياسية 
والتي يسميها برنامج ستاتا (rimin) y (max)‏ لحساب نسخة جديدة لمدى 
المعايرة للمجتمع. 
.summarize gdp‏ 
Variable Obs Mean Std. Dev. Min Max‏ 


gdp 179 12118.74 13942.34 279.8 74906 


.return list 


scalars: 
r(N) = 179 
r(sum_w) = 179 
r(mean) = 12118.73919336756 
r(Var) - 194388878.6050418 
r(sd) - 13942.34121677711 
r(min) - 279.7999877929688 
r(max) - 74906 
r(sum) - 2169254.315612793 


generate rgdp = gdp/(r(max) - r(min)) 
-label variable rgdp "Range-standardized GDP" 


يمكن استخدام أوامر مشابهة أخرى لإنشاء نسخ من مدى المعايرة 
لمتغيرات ظروف المعيشة: 

-quietly summ school 

generate rschool = school/(r(max) - r(min)) 


elabel variable  rschool "Range-standardized 
schooling" 
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.quietly summ adfert 

.generate radfert = adfert/(r(max) - r(min)) 
.label variable radfert "Range-standardized 
adolescent fertility' 


وهكذا معرقاً المتغيرات 8 الجديدة والتي تظهر بالقائمة Lou‏ 
.describe rgdp-rfemlab‏ 


storage display value 
variable name type format label variable label 
rgdp float $9.0g Range-standardized GDP 
rschool float %9.0g Range-standardized schooling 
radfert float %9.0g Range-standardized adolescent fertility 
rfemlab float $9.0g Range-standardized female labor 
rchldmort float %9.0g Range-standardized child mortality 
rlife float $9.0g Range-standardized life expectancy 
rpop float %9.0g Range-standardized population 
rurban float %9.0g Range-standardized percent urban 


13 لم تكن أوامر generate‏ التي تم استخدامها سابقاً صحيحة؛ فإن مدى 
متغيرات مدى المعايرة الجديدة يجب أن يساوي 1« الأمر tabstat‏ يؤكد ذلك. 
.tabstat rgdp - rfemlab, statistics(range)‏ 


rgdp  rschool  radfert rfemlab rchldm-t rlife rpop rurban 





stats 











1 .9999999 1 1 1 1 1 .999999; 


عند تحويل المتغيرات التي تهمنا إلى الصيغة المعيارية يمكننا إجراء 
التحليل العنقودي» وعند قيامنا بتصنيف أكثر من 100 دولة إلى عدة أنواع 
فإنه ليس لدينا أي سبب لافتراض أن كل نوع سوف يتضمن نفس عدد 
الدول» الرابط المتوسط (الذي تم استخدامه مع بيانات الكواكب) مع gaa‏ 
الطرق الأخرى يعطي كل مشاهدة نفس «O3‏ هذا يجعل العناقهد أكبر 
iuh sd,‏ أثناء عمليات التجميع. ومن ناحية esl‏ فإن طرق المتوسط 
الموزون والرابط المتوسط تعطي وزناً متساوياً لكل عنقود بغض النظر عن 
عدد المشاهدات التي يحتويها. وبالتالي فإن مثل هذه الطرق تعمل بشكل جيد 
للكشف عن العناقيد غير متساوية الحجم» الرابط الوسيط يشبه الرابط 
المركزي حيث إنه عرضة للانعكاسات (والتي سوف تحدث مع هذه البيانات) 
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ج للقت URNA‏ اق c MEM‏ يت ال a‏ ...أ لوت a‏ تسر 


لذلك فإن المثال التالي يقوم بتطبيق الربط المتوسط الموزون» كما أن مسافة 
القيمة المطلقة (measure(L1))‏ تعتبر طريقة لقياس الاختلاف. 


-cluster waveragelinkage rgdp - rfemlab, 
measure(L1) name(Liwav) 


التحليل العنقودي الكامل يقوم بإنتاج شكل شجري كبير جداً: 


.Cluster dendrogram 
too many leaves; consider using the cutvalue() 
or cutnumber() options r(198): 


بعد ظهور رسالة الخطأ أعلاهء فإن الشكل )5.11( يقوم باستخدام الخيار 
cutnumber(100)‏ لإنشاء USA‏ شجري يبدأ مع 100 مجموعة بعد فترة 
بسيطة من بداية أول عمليات الدمج. 


.Cluster dendrogram, ylabel(0(.5)3) 
cutnumber(100) 


Dendrogram for L1wav cluster analysis 


L1 dissimilarity measure 
1 135 2 2.5 


5 





الشكل )5.11( 


Y‏ يمكن قراءة التوصيفات الموجودة أسفل الشكل )5.11( ولكن يمكننا 
تتبع الاتجأه العام للتحليل العنقودي. أغلب عمليات الدمج تمت عند اختلافات 
أقل من 1. هنأك دولتان فقط في مركز الشكل الشجري وهذا غير معتاد. هاتان 
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الدولتان قامتا بمقاومة الدمج حتى درجة اختلاف تساوي 2 dyi‏ حيث إن 
هاتين الدولتين المستقرتين تختلفان عن كل الدول الأخرىء هذا daly‏ من أربعة 
عناقيد باقية في مستوى الاختلاف الأعلى من .2( الأول والرابع من هذه 
العناقيد الأربعة (اقرأ من اليسار إلى اليمين) تظهر غير متجانسة وتم إنشاؤها 
من خلال عمليات دمج متتالية لعدد من المجموعات الفرعية الرئيسة الواضحة. 
وعلى خلاف ذلك فإن العنقود الثاني يظهر أكثر Lass‏ حيث إنه يجمع بين 
العديد من الدول التي تم دمجها فني مجموعتين فرعيتين لهما اختلاف أقل من 1 
ثم دمجهما في مجموعة واحدة عند مستوى اختلاف أعلى من 1 بقليل. 

الشكل )6.11( يعرض وضعية أخرى لهذا التحليل» وهذه المرة 
باستخدام الخيار cutvalue(1.2)‏ لعرض العناقيد فقط التي يكون اختلافها أعلى 
من 1.2 بعد القيام بأغلب عمليات الدمج» الخيار showcount‏ يقوم بتحويل 
التوصيفات أسفل الشكل البياني (n213, 5-11, ete)‏ وهي تشير إلى aae.‏ الدول 
في كل Cus eo gone‏ إننا نرى أن المجموعات 8( 9« 12 تحتوي كل منها 
على دولة واحدة فقط. 


.Cluster dendrogram, ylabel(0(.5)3) 
cutvalue(1.2) showcount 


Dendrogram for L1wav cluster analysis 


2 2:5 
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L1 dissimilarity measure 
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“Gi G2 G3 G4 G5 G6 G7 G8 G9 G10 G11 G12 G13 G14 G15 
n=13n=11 n-3 n=6 n=45n=15n=33 n-1 n=1 n=15 n-4 n-1 n-2 n-9 n-10 


الشكل )6.11( 
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الشكل (6.11) يوضح بأن هناك 15 مجموعة باقية عند درجة اختلاف 
أعلى من 1.2 للتوضيح فقط سوف تأخذ في الاعتبار أعلى أربع مجموعات 
فقط والتي لها درجة اختلاف أعلى من 2 cluster generate pe‏ يقوم 
بإنشاء متغير تصنيفي لكل المجموعات الأربع النهائية من التحليل العنقودي 
ونقوم بتسميته LIway‏ 


.Cluster generate ctype - groups(4), 
name(Liwav) 
.label variable ctype "Country type' 


وسوف نقوم في الخطوة التالية باختبار ماهي الدول التي تعود لكل 
مجموعة وذلك من خلال طباعة الأمر: 


¿sort ctype 
.by ctype: list country 


القائمة الطويلة الناتجة من الأمر أعلاه - لم يتم عرضها هنا - توضح 
بأن هناك عنقودًا به دولتان لاحظنا وجودهما في الشكل )5.11( من النوع 3 
Ua g‏ الهند والصينء والعنقود الثاني المتجانس نسبيا في الشكل )5.11( 
والذي يُصنف كنوع 4 يتضمن مجموعة كبيرة من أفقر الدول وأغلبها دول 
أفريقية؛ النوع 2 وهو متنوع نسبياً يحتوي على الدول الأكثر loc‏ وهي 
تتضمن الولايات المتحدة واليابان والعديد من الدول الأوروبية:؛ النوع 1 
متنوع أيضاً يتضمن الدول التي بها مستويات معيشة متوسطة؛ ويظل السؤال 
الموضوعي هو ما إذا كانت هذه الأنواع ذات معنى» وهذا السؤال ليس 
إحصائياء والإجابة تعتمد على الاستخدامات. وما هي التصنيفات التي نحتاج 
إليهاء الاختيار بين مجموعة مختلفة من الخيارات في خطوات التحليل 
العنقودي سوف يؤدي إلى الحصول على نتائج مختلفة» وبإجراء التحليل مع 
مجموعة متعددة من الخيارات سوف نتعرف على أكثر النتائج استقرارا. 
استحدام الدرجات العاملية 3 asl‏ : 


Using Factor Scores in Regression 


تحليل المكونات الرئيسة» والتحليل العاملي في العادة يساعدان على 
تعريف المتغيرات المركبة الجديدة لإجراء عمليات تحليل أكشرء فمثلا 
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الدرجات العاملية والتي يتم حسابها predict VL‏ يمكن أن تصبح متغيرات 
مسنقلة أو غير مستقلة في تحليل الانحدار اللاحق. ولتوضيح ذلك سوف 
نستخدم بيانات الاستقصاء الموجودة بالملف -PNWsurvey2. 11.dta‏ 

.use C:\data\PNWsurvey2_11.dta, clear 





.describe 
Contains data from C:\data\PNWsurvey2_i1.cta 
obs: 734 Pacific NW CERA survey (February 2011) 
vars: 16 2 Jul 2012 06:11 
size: 13,946 
storage display value 
variable name type format label variable label 
age byte %8.0g age Age in years 
sex byte %8.0g sex Gender 
educ byte 514 . 09 degree Highest degree completed 
party byte — $11.0g party Political party identification 
newcomer byte — $9.0g yesno Moved here within past 5 years 
surveywt float $9.0g CERA survey wt--adults/age/race/sex/county 
forest byte — $13.0g eff Loss of forestry jobs or income 
cutting byte %13.0g eff Overharvesting or heavy cutting of timber 
lesfish byte %13.0g eff Loss of fishing jobs or income 
overfish byte %13.0g eff Overfishing in the ocean 
waterl byte 513 . 09 eff Water quality or pollution issues 
water2 byte 513.09 eff Water supply problems 
varming byte %13.0g eff Global warming or climate change 
sprawl byte %13.0g eff Urban sprawl/development of countryside 
weather byte %13.0g eff Unusual/extreme weather-related events 
losscen byte %13.0g eff Loss of scenic natural beauty 
Sorted by: 


المتغيرات 16 في هذه البيانات تمثل بيانات من استقصاء هاتفي للسكان 
في منطقة ساحلية بشمال غرب المحيط الهادئ. هذا الاستقصاء والذي تم 
إجراؤه في فبراير 2011 يعتبر جزءًا من مبادرة تتضمن سلسلة استقصاءات 
تم القيام بها تحت إشراف منظمة المجتمع والبيئة في المناطق الريفية 
الأمريكية والتي cà ja‏ اختصاراً باسم (CERA)‏ (انظر دراسة Hamilton et al.‏ 
-(2010b; Safford and Hamilton 2010‏ 

في هذا المثال» هناك عشرة أسئلة fas‏ من forest‏ وحٹی losscen‏ 
تستفسر عما إذا كانت قضايا بيئية معينة لها تأثيرات محلية. الأسئلة كانت 


كما يلي: 
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سوف أقوم بقراءة قائمة من القضايا البيئية التي قد تكون مشاكل في 
المناطق الريفية» Lal‏ بشأن المكان الذي تعيش فيه Uli‏ اود أن أعرف ما اذا 
كنت تعتقد أن هذه القضايا ليس لها تأثير أو تأثيرات بسيطة أو تأثيرات 


جوهرية على أسرتك أو المجتمع الذي 


الماضية؟ 
خسارة وظائف بالغابات أو دخل من الغابات؟ 
الإفراط أو التبذير في قط ع أخشاب البناء؟ 

خسارة وظائف صيد الأسماك أو دخل صيد الأسماك؟ 


ليس لها تأثير 


734 
725.97798 
733 


الس الجا ر ى Elie‏ 
e Lal $252‏ وقضايا التلوث؟ 
مشاكل في /مدادات المياه؟ 


تعيش فيه خلال فترة ال 3 سنوات 


الاحتباس الح راري أو التغير المناخي؟ 

الزحف العمراني أو التطور السريع في المناطق الريفية؟ 

الأحداث غير العادية أو البالغة المتعلقة بالطقس؟ 

خسارة الجمال الطبيعي الخلاب؟ 

لكل سؤال يمكن للمشارك في الدراسة أن يقول ما إذا كانت هذه القضايا 
أو تأثيرات بسيطة أو تأثيرات جوهرية على أسرهم أو مجتمعهم. 


Number of obs 
Population size 
Design df 


.Svy: tab forest 


(running tabulate on estimation sample) 


Number of strata = T 
Number of PSUs = 734 







Loss of 
forestry 
jobs or 


income proportions 


Key: proportions = cell proportions 
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العديد من المشاركين أوضحوا بأن الخسارة في وظائف الغابات وصيد 
الأسماك لها تأثيرات بسيطةء وإمدادات المياه والزحف العمراني وخسارة 
الجمال الطبيعي CDN‏ هو مصدر قلق فوري لمنطقتهم كما يصوّر الشكل 
(7.11)» هذا الشكل البياني تم إنشاؤه برسم عشرة أشكال لأعمدة بيانية 
بسيطة باستخدام الأمر catplot‏ مع أوزان تحليلية تم إعطاوها بواسطة المتغير 
aw = surveywt]) surveywt‏ انظر الفصل 4( تم توحيد هذه الأشكال العشرة 
في صورة واحدة باستخدام الأمر -graph combine‏ 
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الشكل )7.11( 


هل القلق حول هذه القضايا البيئية العشر يعكس عدةا أقل من الأيعاد 
الكامنة؟ التحليل العاملي الأساسي مع قيم الشيوع المتكررة (ipf)‏ يُحدد الأبعاد 
الكامنة التي تأخذ في الاعتبار نمط الارتباط بين المتغيرات. 


.factor forest cutting losfish overfish water1 
water2 warming sprawl weather losscen, ipf 
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(obs=734) 

Factor analysis/correlation Number of obs = 734 
Method: iterated principal factors Retained factors = 9 
Rotation: (unrotated) Number of params = 45 



















Factor Eigenvalue Difference Proportion Cumulative 











Factorl 3.34457 2.18016 ° 0.5886 0.5886 
Factor2 1.16440 0.78239 0.2049 0.7936 
Factor3 0.38201 0.06367 0.0672 0.8608 
Factor4 0.31834 0.09420 0.0560 0.9168 
Factor5 0.22413 0.06330 0.0394 0.9563 
Factor6 0.16083 0.11590 0.0283 0.9846 
Factor7 0.04494 0.00940 0.0079 0.9925 
Factor8 0.03554 0.02822 0.0063 0.9988 
Factor9 0.00732 0.00757 0.0013 1.0000 


Factorl0 -0.00025 5 -0.0000 1.0000 
LR test: independent vs. saturated: chi2(45) - 2030.48 Prob»chi2 - 0.0000 


Factor loadings (pattern matrix) and unique variances 


——————————————————————————— 


Variable Factori  Factor2  Factor3  Factor4  Factor5  Factor6 Factor? 








forest 0.3408 0.6168 0.0569 0.3357 -0.0288 0.0285 0.0608 
cutting 0.6254 0.1541 0.0641 -0.0126 -0.3822 -0.0466 0.0004 
losfish 0.4637 0.6746 -0.0195 -0.0834 0.2061 0.0068 -0.0727 
overfish 0.6568 0.2032 -0.0637 -0.3887 -0.0030 -0.0670 0.0416 
waterl 0.6410 -0.1694  -0.2377 0.0438 -0.0795 0.2092  -0.1172 
water2 0.6181  -0.2101  -0.3671 0.1051 0.0989 0.0258 0.1055 
warming 0.6393 -0.2047 0.2271 -0.0950 0.0374 0.1280 0.0772 

sprawl 0.6046 -0.2189 -0.0078 0.1117 0.0683 -0.1921 -0.0294 
weather 0.4960 -0.1952 0.3432 0.0485 0.1012 0.1310 -0.0129 
losscen 0.6144 -0.2511 0.0976 0.1033 0.0483 -0.1960 -0.0486 


: ; 









Variable Uniqueness 





















forest 0.0347 0.0045 0.3809 
cutting -0.0223 -0.0035 0.4321 
losfish -0.0585 -0.0069 0.2713 

overfish 0.0818 0.0049 0.3593 

water1 0.0083 0.0041 0.4381 

water2 0.0078 -0.0146 0.4061 
warming -0.1150 0.0029 0.4518 

sprawl -0.0163 0.0625 0.5273 
weather 0.1005 0.0029 0.5580 
losscen 0.0017 -0.0554 0.4930 
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كم عدد العوامل التي يجب علينا حفظها؟ أول اثنين فقط قيمة الجذر 
الكامن لها أعلى من 1 بالرغم من أنها مع التحليل العاملي الأساسي (لا 
يتشابه مع تحليل المكونات الرئيسة) قطع قيمة الجذر الكامن لها - 1 في 
بعض الأحيان يُعتبر دقيقة dax‏ الرسم البياني للحصى والحجارة (الشكل 
8.11( يؤكد بيانياً أنه بعد أول عاملين هناك قيمة جذر كامن منخفضة مع 

ثبات باقي العوامل الأخرى. 
.Screeplot‏ 


Scree plot of eigenvalues after factor 
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الشكل )8.11( 


بعد تجارب ASÍ‏ مع العاملين الاثنين المحتفظ بهما والمدوّرة سوف تكون 
هناك ثلاثة عوامل أو أكثر (لم يتم عرضها هنا) كما يبدو أن العاملين الاثنين 
لهما نتائج أفضل وقابلة للتفسيرء وهذا شيء مهم يجب أخذه في الاعتبارء 
عندما نقرر الاستمرار مع العاملين» فإن أول خطوة (لأننا نستخدم التحليل 
العاملي الرئيس التكراري) تتضمن تكرار التحليل مع الاقتصار على عاملين 


-factor(2) 
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.factor forest cutting losfish overfish water1 
water2 warming sprawl weather  losscen, ipf 


factor(2) 

(obs=734) 

Factor analysis/correlation Number of obs E 734 
Method: iterated principal factors Retained factors - 2 
Rotation: (unrotated) Number of params - 19 











Eigenvalue Difference Proportion Cumulative 










Factorl 3.20673 2.14023 0.7504 0.7504 
Factor2 1.05650 0.85629 0.2496 1.0000 
Factor3 0.21021 0.08664 0.0492 1.0492 
Factor4 0.12357 0.03148 0.0289 1.0781 
Factor5 0.09209 0.06060 0.0215 1.0997 
Factor6 0.03149 0.08506 0.0074 1.1070 
Factor? -0.05357 0.05634 -0.0125 1.0945 
Factor8 -0.10991 0.00827 -0.0257 1.0688 
Factor9 -0.11817 0.05758 -0.0277 1.0411 
Factor10 -0.17575 à -0.0411 Ty 


LR test: independent vs. saturated: chi2(45) = 2030.48 Prob>chi2 = 0.0000 


Factor loadings (pattern matrix) and unique variances 








Variable Uniqueness 





forest 0. 0 0.6439 
cutting 0.6020 0.1239 0.6223 
losfish 0.4788 0.7268 0.2425 

overfish 0.6289 0.1824 0:5713 

water1 0.6249 -0.1549 0.5855 

water2 0.5916 -0.1811 0.6172 
warming 0.6305 -0.1924 0.5654 

sprawl 0.6074 -0.2205 0.5824 
weather 0.4799 =0 2270 0.7384 
losscen 0.6155 -0.2515 0.5579 


طريقة تدوير المحاور بروماكس Promax‏ (منحرف) يبط الأنماط 
العامليةء بينما يسمح بدرجة ما من الارتباط بين العوامل؛ ca bs YI‏ 
العوامل سوف يكون إحصائياً ضعيفاً GY chaa‏ هذه العوامل لها تباين 
متقاطع» وعموماً فقد فقد تكون هذه العوامل أكثر واقعية إذا تم اعتبار أنها تمثل 
أساساً وليس من الضروري lel‏ أبعاد لها علاقة بالقضايا البيئية. 
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.rotate, promax 


Factor analysis/correlation Number of obs = 734 
Method: iterated principal factors Retained factors = 2 
Rotation: oblique promax (Kaiser off) Number of params = 19 











Factor Variance Proportion Rotated factors are correlated 









3.06450 0.7171 
1.86514 0.4365 





Factorl 
Factor2 





LR test: independent vs. saturated: chi2(45) = 2030.48 Prob>chi2 = 0.0000 


Rotated factor loadings (pattern matrix) and unique variances 


Factorl Factor2 











Variable Uniqueness 


forest -0.0567 .6164 0.6439 
cutting 0.6223 
losfish 0.2425 

overfish 0.5713 

water1 0.5855 

water2 0.6172 
warming 0.5654 

sprawl 0.5824 
weather 0.7384 
losscen 0.5579 


Factor rotation matrix 












Factorl Factor2 











0.6109 
0,7917 


0.9662 
-0.2578 





Factorl 
Factor2 





أسئلة الاستقصاء حول تأثيرات جودة المياهء أو قضايا إمدادات المياه 
والاحتباس الحراريء والأحداث غير العادية المتعلقة بالطقس Cà s My‏ 
العمراني» وخسارة الجمال الطبيعي الخلاب كلها تكون أعلى بكثير في العامل 
الأول 1 «factor‏ والقلق حول خسارة وظائف صيد الأسماك overfish‏ ووظائف 
الغابات cutting‏ لها نفس التشبع على العاملين الأول والثاني Gling cles‏ على 
هذا النمط يمكننا تفسير العامل الأول 1 factor‏ على أنه يمثل القضايا البيئتية 
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eS Eee Eee‏ 
العامة والعامل الثاني 2 factor‏ يمثل القضايا المتعلقة بمصادر الوظائفء الأمر 
predict‏ يقوم بحساب القيم العاملية والتي يتم تعريفها بواسطة المتغيرات 
المركبة كمجاميع للقيم المعيارية للمتغيرات وأوزانها من خلال قيمها العاملية؛ 
المتغيران المركبان الجديدان تم تسميتهما enviro eda‏ و -resjobs‏ 

.predict enviro resjobs 


(regression scoring assumed) 


Scoring coefficients (method - regression; based on promax(3) rotated factors) 












Variable Factorl Factor2 











forest 0.00448 0.15784 
cutting 0.12496 0 
losfish 0.01218 0. 

overfish 0.13504 0. 

waterl 0.18799 0. 

water2 0.16724 0. 
warming 0.20531 0. 

sprawl 0.19251 -0. 
weather 0.11661 0. 
losscen 0.21054 -0. 





¿label variable enviro "Pollution, sprawl and 
Scenic effects' 
.label variable  resjobs "Resource job loss 





enviro 734 -1.38e-09 -9112633 -1.307359 2.209436 
resjobs 734 9.40e-11 .9039373 -1.912148 .9766908 


علماء الاجتماع يقومون بإنشاء متغيرات مركبة جديدة والبحث عن دليل 
عن صدق هذه المتغيرات أو علاقتها مع ما نعتقد أن هذه المتغيرات «Oui‏ 
في هذا المثال ale‏ عياف من penguin iioc sa sii‏ 
يُدعم بواسطة نمط قابل لشرح التشبع العاملي. النوع الثاني وهو الصدق 
المعياري الذي يمكن اكتشافه باختبار ما إذا كانت المتغيرات الجديدة مرتبطة 
مع متغيرات أخرى التي توقعتها دراسات أو نظريات سابقة» فا LN‏ 
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نتيجة من بحث استقصائي حول قضايا البيئة في GLY ll‏ المتحدة كانت 
نتيجة انتشار تأثيرات أيديولوجية أو خط حزب معينء الرسم البياني 
الصندوقي يعرض توزيع القيم على عامل القضايا البيئية (enviro)‏ مع الانتماء 
السياسي للمشاركين في الدراسة y Cus «party.‏ إن الرسم يعرض بوضوح هذا 
النمط المتوقع» في في الشكل )7.11( هناك خط أفقي يمثل الوسيط العام والذي 

تم الحصول عليه من نتيجة r(p50)‏ الخاصة بالأمر summarize, detail‏ مع 
أوزان معاينة الاستقصاء التي تستخدم كأوزان تحليليةء ضمن المشاركين في 
الدراسة الذين يعرفون أنفسهم بأنهم جمهوريون لهم قيم عالية للمتغير senviro‏ 
وهذه القيم تظهر وكأنها قيم متطرفة. 

.quietly summ enviro, detail 


.graph box enviro [aw = surveywt], over(party) 
yline(^r(p50)') 


Pollution, sprawl and scenic effects 








الشكل )9.11( 


النتيجة ASI‏ شيوعاً - والتي كانت ضمن تتائج البحوث السابقة - 
تتضمن تأثيرات للعمر والجنس والتعليم. CERA. iG‏ مهتمون حول ما lj‏ 
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eos... Henn. mL ÉL ee‏ وروت الس ...الى مس a‏ 
كان الإدراك البيئي أو التوعية البيئية للسكان الجدد بالمناطق الريفية يختلدف 
عن إدراك السكان الذين يعيشون منذ فترة طويلة. الانحدار المعروض أدناه 
as‏ تأثيرات ld‏ معنوية للتعليم» والانتماء السياسيء والقادمين الجديدء 
المشاركون في الدراسة الذين لهم مستوى تعليم أعلى وهم إما ديمقراطيون أو 
مستقلون وهم أيضاً عاشوا في المنطقة لأكثر من 5 سنوات في العادة 
يتفيّمون التأثيرات المحلية الناتجة عن المشاكل البيئية. 

.Svy: regress enviro age-newcomer 

(running regress on estimation sample) 


Survey: Linear regression 


Number of strata  - d Number of obs = 734 
Number of PSUs = 734 Population size = 725.97798 
Design df = 733 
F( 5í 729) = 15.64 
Prob > F = 0.0000 
R-squared = 0.1275 






Linearized 
Coef. Std. Err. t P>|t| [95$ Conf. Interval] 













enviro 





age -.0008836 — .0027041 -0.33 0.744 -.0061923 .004425 

sex .1037294 — .0807127 1.29 0.199 -.0547262 .2621849 

educ -1037535  .0383315 2.71 0.007 .0285008 .1790062 
party -.2949115  .0430073 -6.86 0.000 -.3793436 — -.2104794 
newcomer | -.2197846  .1089288 -2.02 0.044 -.4336341 -.005935 
-cons .2841083 .2264291 1.25 0.210 ~.1604185 . 7286351 





هناك انحدار مشابه مع العامل المتعلق بمصادر الوظائف resjobs‏ والذي 
وجد بأن هذا المتغير (AG dl‏ بالتعليم أو Yang Lulu‏ من elis‏ فن منتغير 
العمر والسكان الجدد هما أقوى متغيرات تنبؤية. فصغار السن المشاركون 
في الدراسة والذين انتقلوا للمنطقة خلال السنوات الخمس الماضية في العادة 
od‏ إدراكاً للتأثيرات الناتجة من خسارة الوظائف في مجال الغابات وصيد 
الأسماك. 


.Svy: regress resjobs age-newcomer 
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nun. dd Sé ———— À——— A‏ 


(running regress on estimation sample 


Survey: Linear regression 


Number of strata  - Number of obs = 734 
Number of PSUs = 734 Population size = 725.97798 
Design df = 733 
F( 5; 729) = 6.02 
Prob > F = 0.0000 
R-squared = 0.0792 










Linearized 
Coef. Std. Err. t P»|t| (95% Conf. Interval] 









resjobs 





age .008514 .0031023 2.74 0.006 .0024235 .0146045 

sex .0826771 .0883132 0.94 0.349 -.0906998 .2560541 

educ .0613762 .0414013 1.48 0.139 -.0199031 .1426555 
party -.0835506 .0479571 -1.74 0.082 -.1777002 .010599 
newcomer -.3624841 .1330725 -2.72 0.007 -.6237327 -.1012354 
cons - 488574 + 2391453 -2.04 0.041 -.9580654 -.0190826 






الفياس وتماذخ اطعادلة الهيكلية : 


Measurement and Structural Equation Models 


Jail‏ )8(« ألقى نظرة على نماذج المعادلة الهيكلية بداية من متال 
الانحدارء الذي يتضمن علاقات بين مجموعة متغيرات (الشكل 14.8(« 
نماذج المعادلة الهيكلية يمكن أن تشمل E‏ قياس» والتي تشبه التحليل 
العاملي. نماذج القياس تشير إلى وا احد أو أكثر من المتغيرات الكامنة العاملية 
أو غير المشاهدة والتي Les s ais‏ في المتغيرات المشاهدة؛ الشكل )10.11( 
يوضح ذلك باستخدام بيانات استقصاء منطقة شمال غرب المحيط الهادئ 
.CERA‏ ` 
.use C:\data\PNWsurvey2_11.dta, clear‏ 
يظهر في الشكل (10.11) متغيران كامنان وغير مشاهدين وهما 
.Resjobs «Enviro‏ أسماء هذه المتغيرات تم قصداً وضعهما بحيث تشبه القيم 
العاملية في الجزء السابق من هذا الفصلء ولكن في هذا التحليل سوف نبدأ 
من جديد» فلا as‏ متغيرات لها نفس هذه الأسماء؛ عند صياغة نموذج 
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لج ايه NL. ee‏ لاا caecus AIC. Un‏ 01ت 9 


المعادلة الهيكلية يقوم برنامج ستاتا (وهذا هو الوضع الافتراضي للبرنامج) 
باتباع طريقة لتمثيل المتغيرات الكامنة مع أسماء تبدأ بحروف كبيرة» المتغير 
الكامن Enviro‏ يتم رسمه بحيث يوضح أن بعض التباينات في ستة متغيرات 
غير مشاهدة» ونفس هذه المتغيرات يتم تحميلها بشكل رئيس للعامل الأول 
factor 1‏ في الجزء السابق» المتغير الكامن Resjobs‏ يشر ح التباين في أربعة 
متغيرات غير مشاهدة أخرىء والتي يتم تحميلها بشكل رئيس أو جزئي 
للعامل الثاني 2 cfactor‏ لاحظ Gly‏ العرض البياني للأشكال الدائرية يوضح 
المتغيرات ALLS‏ بينما المستطيلات تعرض المتغيرات alidi‏ والسهم 
المائل ذو الرأسين يمثل العلاقة غير السببية بين المتغيرين -Resjobs «Enviro‏ 





الشكل (10.11) 


تم إنشاء الشكل أعلاه باستخدام SEM Builder‏ ببرنامج ستاتاء ويمكنك 
القيام بذلك عن طريق الخطوات التالية: 


Statistics > SEM (structural equation modeling) > Model 
building and estimation 


اختر أداة Add measurement Component (M)‏ من الهامش الأيسر 
للنافذة» ثم ضع مؤشر الفارة في الموقع الذي تريده للمتغير الكامن بمنطقة 
الرسم» قم بإعطاء المتغير الكامن اسما يبدأ بحرف كبير مثل Enviro‏ ثم 
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اختر متغيرات القياس Measurement variables‏ ليتم شرحها بواسطة 
المتغير الكامن؛ وذلك باختيار أسمائها من قائمةء بعد ذلك قم باختيار اتجاه 
القياس Measurement direction‏ مثل UP‏ واضغط «OK‏ ثم قم بإعادة هذه 
الخطوات مع المتغير الكامن الثاني في موقع آخر مثل Resjobs‏ مع وضع 
Measurement direction‏ إلى «Down‏ ثم اضغط OK‏ مرة ecg yal‏ أخيرا 
قم باستخدام أداة Add covariance (C)‏ من الهامش الأيسر وذلك لوضع 
السهم المنحني ذي الرأسين للتباين أو الارتباط بين المتغيرات الكامنة. 

الشكل (11.11) يعرض نفس نموذج القياس بعد التقديرء المُعَاملات مع 
مساراتها من المتغيرات الكامنة إلى المتغيرات المشاهدة تمشل COL RÀ‏ 
الارتباط المعياريق وهي تشبه التشبعات العاملية. كل متغير مشاهد له قيمة 
ug shu‏ قيمة تباينه الفريدة والتي ales‏ بواسطة شروط 0 (إيسلون (epsilon‏ 
في نموذج المسار dis‏ المتغيران 0 و Lel Resjobs‏ ارتباط يساوي 0.62 





الشكل (11.11) 


عند رسم نموذج مسار مثل الذي يظهر في الشكل )10.11( قم بالنقر 
على Estimate‏ وسوف ترى أن النتائج الإحصائية بدأت بالظهور على 
الرسم البياني. برنامج ستاتا يعرض معلومات كثيرة افتراضياء ولكن لبعض 
الأغراض - مثل أغراض النشر - قد نحتاج إلى الاحتفاظ بالرسم بشكل 
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Jas ومُعاملات‎ tela Sin] SITES å (11. 11) الشكل‎ caa 
المعيارية أو التباينات. ويتم عرض كل ذلك في تنسيق ثابت مع رقمين في‎ 
Us يمين الفاصلة العشريةء وتم تبسيط الرسم البياني والتحكم فيه من‎ 

خيارات القوائم التالية: 
Settings < Variables < All ... < Results » Exogenous variables <‏ 
None » OK‏ 


Settings > Variables > All ... > Results > Endogenous variables 
> None > OK 


Variables < Error ... » Results < Error std. variance »‏ » ند 
peas > Connections > Paths > Results > Std. parameter >‏ 


Settings > Connections > All > Results > Result 1 > Format 
903.2f > OK > OK 


Estimation > Estimate > Weights > Sampling weights ...‏ 
OK‏ > (قم باختيار متغيرات مثل (surveywt‏ 
نفس النموذج يمكن تقديره مباشرة عن طريق الأمر sem‏ بدون استخدام 
SEM Builder‏ في الأمر أدناه لاحظ استخدام svy:‏ قبل الأمر والتي تقوم 
بتطبيق وزن للاستقصاء للأمر sem‏ كما قامت بفعله من قبل مع الأمر 
regress‏ والعديد من عمليات ستاتا الأخرى» المُعاملات المعيارية من هذه 
المخرجات تتوافق مع مُعَاملات المسار في الشكل )11.11( كما أن التباينات 
الفريدة الخاصة بالمتغيرات المشاهدة و e‏ المعياري (أي الارتباط) بين 


المتغيرات الكامنة» وبالمثل فإنها تتو مع القيم المعروضة في الشكل 
)11.11( 
.Svy: sem (Enviro ->wateril water2 warming‏ 


sprawl weather  losscen) (Resjobs ->forest 
cutting losfish overfish), standard 


(running sem on estimation sample) 
Survey: Structural equation model 
734 


725.97798 
733. 


Number of strata = 1 Number of obs 
Number of PSUs = 734 Population size 
Design df 


"og od 


(1) [waterl]Enviro = 1 
(2) [forest]Resjobs = 1 
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Linearized 
Coef. Std. Err. t P»|t| [95$ Conf. Interval 






Standardized 





Measurement 

waterl «- 
.6617216 .0305711 21.65 0.000 .6017043 . 7217389 
-9865716 .0405518 24.33 0.000 .9069601 1.066183 


Enviro 
_cons 







water2 <- 
Enviro 
_cons 








. 6474885 . 033683 19.22 0.000 - 5813618 . 7136151 
+ 6092422 - 0301459 20.21 0.000 . 5500596 . 6684249 











warming <- 
Enviro 6604354 .0295415 22.36 0.000 .6024393 .7184315 


.cons .9570574 .0398204 24.03 0.000 .8788818 1.035233 







sprawl «- 









.6331502 .0394133 16.06 0.000 .5557738 .7105265 
.8070991 .0351607 22.95 0.000 + 7380715 - 8761267 


Enviro 





—cons 


weather <- 
Enviro .4872326  .0408934 11.91 0.000 -4069505 .5675148 
_cons 1.229424 .0493018 24.94 0.000 1.132634 1.326213 
| US eS 
è 
losscen <- 
Enviro . 6868967 .0336976 20.38 0.000 .6207413 .7530521 
_cons - 8308351 . 0357022 23.27 0.000 . 7607443 .9009259 
forest «- 
Resjobs .4351381 .0782853 5.56 0.000 .2814481 .5888282 


_cons 1.701551 . 0851467 19.98 0.000 1.534391 1.868712 

cutting <- 
Resjobs . 5800483 - 0483413 12.00 0.000 4851445 .6749521 
_cons 1.086461 .0455767 23.84 0.000 .9969847 1.175938 


losfish «- 
Resjobs .611518 .0646856 9.45 0.000 .4845268 .7385092 
_cons 1.699434 .0899735 18.89 0.000 1.522798 1.876071 








overfish «- 
Resjobs .7640356 .0396915 19.25 0.000 .686113 .8419582 
_cons 1.211127 .0531622 22.78 0.000 1.106759 1.315495 
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لوجتت تاوت E Ode QURE: cuml — cot c cid,‏ 


.6474398 
.6730265 
6458784 
. 7055699 
. 8449901 
-6273445 
. 9560745 
«7833023 
- 8023236 
-5540985 


-7378782 


. 4880516 
.5011403 
.4921959 
.5087318 
.6882511 
-4446786 
.6873535 
.5620954 
-4884978 
-3126948 


0.000 - 5010833 


.0404591 
.0436187 
.0390206 


-049909 


.0398492 
.0462936 
.0681298 
.0560805 
.0791129 
. 0606515 


. 0603082 10.27 


.5621246 
-5807587 


-563825 


-5991209 
-7626044 
-5281729 
-8106548 


-663544 


. 6260458 
.4162496 


1 
1 


.6194808 





Variance 
e.waterl 
e.water2 

e.warming 
e.sprawl 
e.weather 
e.losscen 
e.forest 
e.cutting 
e.losfish 
e.overfish 
Enviro 
Resjobs 


Covariance 
Enviro 
Resjobs 


الشكل (12.11) يعرض مثالا يتم فيه دمج نموذج قياس (متغير كامن 
Enviro‏ موضحا التباين في ستة متغيرات مشاهدة» وهي من المتغير water]‏ 
وحتى المتغير (losscen‏ مع نموذج انحدار يكون فيه المتغير Enviro‏ نفسه يتم 
تفسيره بواسطة خمسة متغيرات خلفية مشاهدة» وهي من متغير age‏ وحتى متغير 
«newcomer‏ وبالتالي فإن الشكل )12.11( يشبه التحليل الذي قمنا به ني الجزء 
السابق آخذاً القيم العاملية للمتغير enviro‏ كمتغير تابع له انحدار على المتغيرات 
من المتغير age‏ وحتى المتغير newcomer‏ طريقة المعادلة المركبة تقوم بدمج 
سمات التحليل العاملي والانحدار في نموذج واحدء والطريقة تقوم بتقدير واختبار 
مدى واسعاً من الطرق الأخرى لصياغة النماذج مشل ارتباطات الأخطاء 
والعلاقات التي تتضمن المتغيرات الكامنة أو المتغيرات المشاهدة الأخرى. 


الشكل (12.11) 
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الأمر التالي يقوم بتقدير نفس النموذج الذي شاهدناه في الشكل (12.11) 
مع تفاصيل أكثر. 


.Svy: sem (Enviro ->waterl water2 warming 
sprawl weather losscen) (age sex educ party 
newcomer ->Enviro), standard 
(running sem on estimation sample) 
survey: Structural equation model 
Number of strata = 1 Number of obs = 734 
Number of PSUs = 734 Population size = 725.97798 
Design df = 733 
(1) [waterl]Enviro = 1 
Linearized 
Standardized Coef. Std. Err. t P>|t| [95$ Conf. Interval 


Structural 
Enviro «- 


.0632614 
.1616375 
.2168698 
-.2145423 
-.0031639 


.7078856 
1.663153 


.6984623 
1.260855 


+ 7381521 
1.655089 


-.1628914 
-.0389826 

.0238449 
-.4110573 
-.2155094 


5779073 
.9580347 


.5506384 
.5872266 


.6184691 
.9328181 


0.387 
0.230 
0.015 
0.000 
0.044 


0.000 
0.000 


.000 
.000 


oo 
oo 


0.00€ 
0.000 


-0.86 
1.20 
2.45 

-6.25 

-2.02 


19.42 
7,30 


16.59 
5.39 


22.25 
6.96 


.0575978 

-051095 
.0491607 
.0500495 
.0540813 


.0331036 
.1795706 


.0376486 
.1715633 


.0304815 
.1864988 


-.049815 
.0613274 
.1203573 
-.3127998 
-.1093366 


.6428964 
1.310619 


.6245504 
.9242407 


.6783106 
1.298954 


age 

sex 

educ 
party 
newcomer 


Measurement 
waterl «- 
Enviro 

_cons 


water2 <- 
Enviro 
_cons 


warming «- 
Enviro 
_cons 





. 7106546 
1.47039 


- 5894638 
1.774549 


.5512803 
.7798741 


.4302065 
1.198254 


0.000 
0.000 


0.000 
0.000 


15.54 
6.40 


12.57 
10.13 


.0405903 
.1758644 


.0405605 
.1467739 


.6309674 
1.125132 


.5098352 
1.486401 


sprawl «- 
Enviro 


_cons 


weather <- 
Enviro 
_cons 





- 7619764 
1.558837 


. 6280033 
+ 8034391 


0.000 
0.000 


20.37 
6.14 


.034121 
.1923889 


.6949899 
1.181138 





losscen «- 
Enviro 
_cons 
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Variance 


e.vaterl .5866842 .0425644 .5087998 .6764906 
e.water2 .6099368 .0470269 .5242611 + 7096139 
e.warming .5398947 .0413519 . 4645213 . 3 
e.sprawl .6018801 .0512223 .5092718 .7113288 
e.weather . 7400681 .0413584 : - 6631687 + 8258846 
e.losscen .5169891 .0474275 .4317822 .6190105 
e.Enviro .8653113 .0330933 .8027214 .9327815 








وجدنا Gl‏ المتغيرات educ, party, newcomer‏ جميعها لها تأثيرات ذات 
As gine‏ إحصائية على المثغير الكامن Lain «Enviro‏ المتغيرين age, sex‏ ليس 
لهما هذا التأثير. هذه النتائج تتوافق مع النتائج السابقة لانحدار القيم العاملية 
enviro‏ على نفس متغيرات التنبؤية الخمسة. 
ami‏ المعادلة الهيكلية مع برنامج ستاتا هو موضوع واسع 
flay Lise patie‏ له وحده. الأمثلة في هذا الفصل وتلك التي تم تناولها في 
الفصل )8( كانت عبارة عن نظرة سريعة. وللحصول على شرح كامل 
P‏ امر قم بالاطلاع على Sunt‏ المستخدم Structural Equation Modeling‏ 
«Reference. Manual‏ كمأ يحتوي هذا الدليل على نحو مكتبة بها 26 Ls‏ 
تسهل عملية الفهم للقارئ 


تحليل السلاسل الزمنية 


Time Series Analysis 








قدرات برنامج ستاتا مع السلاسل الزمنية تم تغطيتها في 700 صفحة 
بدليل المستخدم .Time-Series Reference Manual‏ هذا الفصل يعطي مقدمة 
مختصرة lad‏ مع أداتين تحليليتين أساسيتين هما: الرسومات البيانية للزمن» 
والتمهيد. ee‏ ننتقل إلى توضيح استخدام تصوير «l5 Nl‏ ونماذج ARIMA‏ 
sins ARMAX 5‏ مع الاختبار ات التشخيصية للاستقرارية stationarity‏ 
والضجة البيضاء white noise‏ هناك تطبيقات أخرى وأهمها شكل الذبذبات» 
ومجموعة نماذج ARCH‏ المرنة تم تركها للقارئ للبحث عنها واستكشافها. 

وبالرغم من S‏ الحلول التقنية لموضوعات السلاسل الزمنية يمكن 
29d‏ عليها في دراسة Hamilton‏ )1994( وهناك مصادر أخرى تتضمن 
CE‏ دراسة Box, Jenkins and Reinsel (1994), Chatfield (2004), Diggle‏ 
Enders (2004) and Shumway (1988)‏ ,)1990(- 


قوائم عمليات تحليل السلاسل الزمنية تأتي تحت تحت العناوين التالية: 
Statistics » Time series‏ 
Statistics » Multivariate time series‏ 
Statistics » Cross-sectional time series‏ 
Graphics » Time-series graphs‏ 


Example Commands : عن الأوامر‎ alioi 


.ac y, lags(8) level(95) generate(newvar) 
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a 
يقوم بإنشاء رسم بياني للارتباطات الذاتية للمتغير رمع فترات قة‎ 
28 (هذا هو الوضع الافتراضي للبرنامج) لفترات تباطو من 1 وحتى‎ 5 
newvar ويقوم بحفظ الارتباطات الذاتية كأول 8 قيم للمتغير‎ 
.arch D.y, arch(i/3) ar(1) ma(1) 
(الانحدار الذاتي لاختلاف التباين المشروط‎ ARCH يقوم بتوفيق‎ 
نموذج مع أو ل اختلافات‎ (autoregressive conditional heteroskedasticity 
من الدرجة الأولى وحتى الدرجة‎ ARCH وهذا يتضمن شروط‎ c y. للمتغير‎ 
.MA 5 AR الثالثة» والدرجة الأولى لأخطاء‎ 
.arima y, arima(1,1,1) 
مع اختلاف الدرجة الأولى‎ ARIMA(LLI) يفوم بتوافق عينة مع نموذج‎ 
الخيارات المحتملة الأخرى‎ «MA 5 AR وشروط اختلاف الدرجة الأولى‎ 
يمكنها تحديد استراتيجيات تقدير بديلة والقيود الخطية والتقديرات الموثوقة‎ 
للتباين.‎ 
.arima y, arima(1,0,2) sarima(1,0,1,12) 
من الدرجة‎ AR مع شروط‎ ARIMA(L02)*(1,0,1)12 يقوم بتوافق نموذج‎ 
من الدرجتين الأولى والثانية» وكذلك مع المكونات‎ MA الأولى» وشروط‎ 
.12 الموسمية المضاعفة مع فترة‎ 
.arima y x1 x2 x3, arima(2,0,1) 
الذاتي مع‎ jas DU (المتوسط المتحرك‎ ARMAX يقوم بحساب انحدار‎ 
المتغيرات الخارجية) للمتغير بر على ثلاثة متغيرات تنبؤية. الأخطاء تم‎ 
صياغتها كمتوسط متحرك من الدرجة الأولى» وانحدار ذاتي من الدرجة‎ 
الثانية.‎ 
.arima D.y X1 L1.x1 x2, ar(1) ma(1 12) 
والذي فيه اختلافات أولية للمتغير برقم‎ ARMAX يقوم بتوافق نموذج‎ 
x1 حساب اتحدارها على المتغير 1× مع قيم لها فترات تباطو 1- للمتغير‎ 
-AR(1), MA(1), MA(12) والمتغير 2× وهذا يتضمن أخطاء‎ 
.corrgram y, 1295 )8( 
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يقوم بحساب الارتباطات الذاتية:ء والارتباطات الذاتية AS jal‏ 
واختبارات 2 لفترات تباطؤ من 1 وحتى 8 للمتغير y‏ 


.dfuller y 
للاستقرارية‎ Dickey-Fuller يقوم بحساب اختبار جذر 9 »$3 ديكي فولر‎ 


„stationarity 
.estat dwatson 


بعد الأمر regress‏ مع بيانات سلاسل زمنية يقوم الأمر أعلاه يبحساب 
إحصائية دوربن واتسون Durbin-Watson‏ لاختبار الارتباط الذاتي من الدرجة 
الأولى. 
.egen newvar - ma(y), nomiss t(7)‏ 
يقوم بإنشاء متغير جديد newvar‏ يساوي فترة 7- ناقلاً متوسط المتغير بر 
ومستبدلاً قيم البداية والنهاية بمتوسطات أقصر وغير مركزية. 
.generate date = mdy(month,day,year)‏ 
يقوم بإنشاء متغير date‏ يساوي arc‏ الأيام منذ 1 يناير 1960 من ثلاثة 
متغيرات هي month, day, year‏ 
.generate date = date(str date, "mdy')‏ 
agis‏ بإنشاء متغير date‏ من متغير نصي ssir date‏ حيست إن str date‏ 
يحتوي على تواريخ يكون ترتيبها شير ويوم وسنة ويكون تنسيقها be‏ 
June, 12”‏ ,1948“ أو ”98/4/18“ أو 2001/11/19»: ولمعرفة دوال التاريخ: 
والخيارات الأخرى. قم بطباعة الأمر .help dates‏ 
generate newvar = L3.y‏ 
يقوم بإنشاء متغير جديد newvar‏ يساوي قيم المتغير برمع فترة تباطؤ 3 
.pac y, lags(8) yline(0) ciopts (bstyle(outline))‏ 
يقوم بإنشاء رسم بياني للارتباطات الذاتية الجزئية مع فترات ثقة وتباين 
متبقي من فترة تباطو 1 وحتى فترة تباطؤ 8( ويقوم بإنشاء خط أفقي عند 
نقطة 0( ويقوم الأمر بعرض فترة الثقة has‏ عريض بدلا من منطقة مضللة 
(والأخير هو الوضع الافتراضي). 
.pergram y, generate(newvar)‏ 
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يقوم برسم عينة ذبذبات All)‏ كثافة الطيف) للمتغير c y.‏ وإنشاء متغير 
جديد باسم newvar‏ يساوي قيم الذبذبات الخام. 
.smooth 73 y, generate(newvar)‏ 
يقوم بإنشاء متغير جديد newvar‏ يساوي الفترة الزمنية 7- مستخدماً e$‏ 
الوسيط للمتغير بره ثم يقوم بإعادة التمهيد باس pass‏ الفشرة الزمنية 3- 
مستخدما قيم Lous oll‏ التمهيد المركب مثل “3RSSH”‏ أو “4253h,twice”‏ 
تكون محتملة» وللحصول على معلومات أكثر عن Slat yall‏ والتمهيدات قم 
بطباعة الأمر -help tssmooth 3 help smooth‏ 
.tsset date, format (%td)‏ 
يقوم باعتبار البيانات وكأنها بيانات سلاسل زمنيةء حيث تم الإشارة إلى 
الوقت باستخدام المتغير date‏ والذي يكون تنسيقه على أساس يومي» أما 
بالنسبة للبيانات الطويلة panel data‏ مع السلاسل الزمنية المتوازية لعدد من 
الوحدات المختلفة مثل المدن» فإن الأمر agi tsset city year‏ بتحديد متغيرات 
الزمن والطول للبيانات» أغلب الأوامر في هذا الفصل تتطلب استخدام الأمر 
tsset‏ مع البيانات. 
.tssmooth ma newvar - y, window(2 1 2)‏ 
يقوم بتطبيق coi fall‏ المتوسط المتحرك للمتغير «رمؤدياً إلى إنشاء متغير 
aewvar aul wis‏ الخيار )2 1 window(2‏ وجد بأن المسافة الزمنية 5- 
للمتوسط المتحرك وذلك من خلال إدراج فترات تباطؤ تساوي 2 وإدراج 
المشاهدة الحالية و2 من القيم الأساسية في حساب كل نقطة تمهيدية. 
ولأحضؤل. على قائمة المُرشحات: الأخرى المتؤافرة والمتوسظات المتحرك ة 
الموزونة والأسيّة والأسيّة المزدوجة وهولت - وينترس Holt-Winters‏ وغير 
Aaa‏ قم بطباعة الأمر help tssmooth‏ - 
.tssmooth nl newvar - y, smoother(4253h,twice)‏ 
يقوم بتطبيق مرشح التمهيد غير الخطي على المتغير «رمؤدياً إلى إنشاء 
متغير جديد «ewvar‏ الخيار smoother(4253h, twice)‏ يقوم بشكل تكراري 
بإيجاد قيم الوسيط لمسافات زمنية هي 3.51244 تطبيق دالة هانج 
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eee eee‏ 


tssmooth nl وبعد ذلك يقوم بتكرار العملية مع البواقي. الأمر‎ Hanning 
لا يمكنه العمل مع القيم المفقودة.‎ Cus ctssmooth يختلف عن باقي أوامر‎ 
.wntestq y, lags(15) 
white للضجة البيضاء‎ Liung-Box portmanteau Q يقوم باحتساب اختبار‎ 
-(corrgram jay! يمكن حساب هذا الاختبار باستخدام‎ LS) noise 
.Xcorr x y, lags(8) xline(0) 
ومخرجات‎ (X) يقوم بإنشاء رسم بياني للارتباط المتقاطع بين مدخلات‎ 
يعطلي نسخة نصية‎ xcorr x y, table Juill .8-1 من‎ bhla لفترات‎ (y) 
إلى‎ generate(newvar) تتضمن الار تباطات الفعلية. وإذا قمنا بإضافة الخيار‎ 
+8 فسوف يتم حفظ الارتباطات لفترات التباطؤ من 8- وحتى‎ xcorr الأمر‎ 
كمتغير في أول 17 صفاً من البيانات.‎ 
Smoothing : التمهيد‎ 


العديد من السلاسل الزمنية يكون لها تباينات عالية ai jill‏ تجعمل من 
الصعب توضيح الأنماط الكامنة» تمهيد smoothing‏ مثل هذه السلاسل تقوم 
بتقسيم البيانات إلى جزعين؛ الأول يتباين بشكل تدريجيء والثشاني 'تقرييا' 
يحتوي على التغيرات الكبيرة المتبقية: 

البيانات = التمهيد + التقريب 

ولتوضيح طرق التمهيد سوف نقوم باختبار بيانات عن الاستهلاك 
اليومي للمياه لقرية ميلفورد Milford‏ بولاية هامبشير Hampshire‏ بالولايات 
المتحدة خلال فترة سبعة أشهر من يناير وحتى يوليو 1983 (البيانات بالملف 
«MlILwater.dta‏ المصدر: در Hamilton Ail‏ 1985(« الأنماط المعتادة لاستخدام 
المياه في ميلفورد كانت قد تغيرت بواسطة الأخبار المقلقة التي حدثت في 
متتصف فر Aud jall‏ 


describe 
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آذ ل لل 222 سس 


Contains data from C:\data\MILwater.dta 











obs: 212 Milford daily water use, 1/1/83 - 7/31/83 
vars: 4 2 Jul 2012 06:11 
size: 1,272 
storage display value 
variable name type format label variable label 
month byte %9.0g Month 
day byte *9.0g Date 
year int 59.09 Year 
water int 59.09 Water use in 1000 gallons 
Sorted by: 


قبل التعمق في التحليل» سوف نحتاج إلى تحويل معلومات الشهر واليوم 
والسنة إلى مؤشر رقمي واحد للزمن. دالة برنامج ستاتا ( )رهم تقوم بهذا 
«Ju sail‏ حيث تقوم بإنشاء متغير الوقت الماضي (والذي سوف نطلق عليه 
هنا (date‏ مشيراً إلى عدد الأيام منذ 1 يناير 1960. 


.generate date - mdy (month, day, year) 
list in 1/5 


month day year water date 





التاريخ المرجعي وهو 1 يناير 1960 هو تاريخ عشوائي ولكن th‏ 
يمكننا أن نجعل تنسيق التاريخ Log Asi‏ للمتغير LS «date‏ يمكننا تجهيز 
البيانات للتحليل لإحقاء وذلك باستخدام الأمر tsset‏ (وهو اختصار Cag yall‏ 
الأو لى من AA‏ بيانات سلاسل زمنية (time series set‏ لتحديد التاريخ date‏ 
كمتغير لمؤشر الزمن» وتحديد الخيار %td(daily)‏ لعرض هذا المتغير. 
.tsset date, format (%td)‏ 
time variable: date, 01jan1983 to 31jul11983‏ 
delta: 1 day‏ 


in 1/5 


„LLSG X 
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month day year water 


01jan1983 
02jan1983 


03jan1983 
043an1983 
05jan1983 


م زج س Qd‏ 





التواريخ في المتغير الجديد date‏ لها تنسيق مثل "05 jan‏ 61983 وهو 
أكثر فهماً وقراءة عن القيم الرقمية المجردة مثل ”8405“ (وهو عبارة عن 
عدد الأيام منذ 1 يناير 1960).؛ كما يمكننا استخدام التتسيق Atd‏ لإنتاج 
تنسيقات أخرى مثل ”05 Jan‏ 1983“ أو ”83/05/01». برنامج ستاتا يوفر عددًا 
من المتغيرات التعريفية؛ وعددًا من تنسيقات العرض وتنسيقات البيانات التي 
لها أهميتها مع السلاسل الزمنية. العديد من هذه التنسيقات يتضمن طرقاً 
للمدخلات والتحويلات وعرض التواريخ. ويمكنك الحصول على شرح 
مفصل عن دوال التواريخ في دليل المستخدم  Data Management Reference‏ 
Manual‏ ودليل المستخدم User's Guide‏ أو يمكنك الاطلاع عليها بطباعة 
الأمر -help dates‏ 

الشكل )1.12( يستخدم شكلاً ias‏ من نوع twoway line‏ لرسم شكل 
بياني بسيط لمتغير استخدام المياه water‏ مع الزمن date‏ الشكل يعرض نمط 
تباين يوم بيوم» كما يوضح أن هناك ارتفاعاً في استخدام المياه في الصيفء 
قيم متغير التاريخ تم وصفها تلقائياً (01 jan‏ 1983 وهكذا) على المحور الأفقي 
× » ولكن خيارات ستاتا الافتراضية هنا تقود إلى نتائج غير مرضيةء 
وتوصيفات متزاحمة في الرسم. 


.graph twoway line waterdate 
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يبيب يي OC‏ 


Water use in 1000 gallons 
600 800 1000 
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الشكل )1.12( 


هناك طريقة أفضل لرسم الزمن» واستخدام متغير التاريخ على المحور 
الأفقي ox‏ ويتم ذلك باستخدام أمر خاص بالسلاسل الزمنية وهو «tsline‏ هذا 
الأمر يسمح لنا بشرح قيم المحور × في ضوء التاريخ بدون الحاجة إلى 
التواريخ في أسفل المحور. فمثلاً يمكننا رسم شكل يوضح الوقت يشبه الشكل 
(1.12) ولكن توصيفات المحور الأفقي لن تكون متزاحمة كما في الشكل 
(1.12). لاحظ أن الأمر tsline‏ لا يقبل أي متغير من متغيرات cx‏ فهو يقبل 
فقط واحد أو ASÍ‏ من متغيرات cy‏ مع بيانات tsset‏ أن سمة الوقت تم تعريفها 
inta‏ والخيارات ) tlabel(‏ و( ttick(‏ تعمل في الرسم البياني «tsline‏ كما 
تعمل الخيارات xtick() 5 xlabel()‏ مع أي شكل بياني من النوع twoway‏ 
باستثناء أنها تفهم تنسيقاً معيناً للوقت مثل 01 jan‏ 1983« في الشكل )2.12( 
قمنا باختصار عناوين المحور الأفقي × (الوقت أو محور (r‏ باستخدام الخيار 
GY title»)‏ كلمة تاريخ “Date”‏ تبدو غير ضرورية أسفل المحور الأفقي 
الذي تم توصيفه 01 mar 01 ›1983 jan‏ 1983 وهكذا. 
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Ee‏ 


.tsline water, ylabel (300 (100) 900) ttitle("") 


tlabel(01jan1983 01mar1983 01may1983 
01ju11983, grid) 


ttick(01feb1983 01apr1983 01jun1983 
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الشكل (2.12) 


wn المجردة يلعب دورًا رئيساً في السلاسل الزمنية.‎ - m 
يساعدنا في أن نرى الأنماط الكامنة تحت السلاسل المتذبذبة. طريقة‎ 
الأبسط يتم استخدامها لحساب المتوسط المتحرك باب عر جاو‎ 
فمثلاً "المتوأسط المتحرك‎ wy على القيم الحالية والسابقة واللاحقة للمتغير‎ 
ة الزمنية 3" يشير إلى المتوسط ,.برء ,برء ر ويمكننا استخدام مميزات‎ 
مثل هذا المتغير:‎ generate ستاتا لإنشاء‎ 


generate water3a = (water[ n-1] + water[ n] + 
water[_n+1])/3 


الطريقة الأفضل ma (ja‏ (المتوسط المتحرك) كدالة للأمر tegen‏ 
¿egen water3b = ma(water), nomiss t(3)‏ 
الخيار nomiss‏ في الأمر egen‏ يجعل المتوسطات المتحركة أقصر وغير 
مركزة à‏ فى أطراف المنحنى» إذا لم نقم باستخدام هذا الخيار» فإن أول وآخر 
قيمة للمتغير 3 سوف تكون lad‏ مفقودة. الخيار t3)‏ يجعل المتوسط 
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المتحرك يكون للفترة الزمنية .3 وأي aae‏ إضافي الفترة الزمنية 3 أو أكثر 
يمكن استخدامه. 

هناك أدوات تمهيد قوية متوافرة لبيانات السلاسل الزمنية (tsset)‏ ويتم 
استخدامها من .خلال الأو أمر ctssmooth‏ كلها يمكنها التعامل مع البيانات 
المفقودة باستثناء tssmooth nl‏ 


tssmooth ma‏ مل شات المتوسط المتحرك أ و الموزونة أو غير 
الموزونة. 
jall tssmooth exponential‏ شحات الأسيّة الفردية. 
PNE jall tssmooth‏ الأسيّة المزدوجة. 


dexponential 
غير الموسمية.‎ Holt-Winters 5 3u5 — هلت‎ aŭ  tssmooth hwinters 
الموسمية.‎ Holt-Winters تمهيد هلت — وينترز‎  tssmooth shwinters 
شات غير الخطية.‎ jall tssmooth nl 
يمكنه حساب المتوسطات‎ tssmooth ma فإن الأمر‎ «ball فعلى سبيل‎ 
السابق:‎ egen المتحركة للفترة الزمنية 3» وهي مطابقة لتلك الناتجة من أمر‎ 
.tssmooth ma water3c - water, window(1 1 1) 


The smoother applied was 
(1/3)*[x(t-1) + 1*x(t) + x(t«1)]; x(t)= water 


لمعرفة تركيبة كل «yal‏ قم بطباعة الأمر help tssmooth ma‏ أو الأمر 
-help tssmooth exponential‏ 

الشكل )3.12( يرسم المتوسط المتحرك لخمسة أيام لاستخدام المياه في 
قرية ميلفورد (water$)‏ معأ مع البيانات الخام -Qwater)‏ الأمر tsline‏ يقوم 
بتركيب رسم الفترة الزمنية لقيم المتغير Spall waters‏ على الرسم البياني للقيم 
الخام للمتغير water‏ (خط (Kea JÉ‏ . توصيفات المحور الأفقي تم n,‏ ها 
باستخدام التواريخ كما فعلنا سابقا مع الشكل (12 56 فى الشكل )12 .3( قمنا 
بتحديد تنسيق عرطن bup‏ للت ارج hales‏ السشهر راليوم 
<format(Yotdmd)‏ هذا التنسيق المبسط للتاريخ يترك مسافة لتوصيف بددية كل 
شهر في هذا الرسم خلافاً لكل شهر «al‏ كما تم سابقاً في الشكل )2.12(. 
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.tssmooth ma water5 - water, window(2 1 2) 
The smoother applied was 
(1/5)*[x(t-2)* x(t-1)+ 1*x(t)4+x(t+1)4+x(t+2)]; x(t)-water 
etsline water, clwidth(medium) 
|| tsline water5, clwidth(medthick) 
|| , ylabel(300(100)900) ytitle("Water use 
in 1000 gallons") 
ttitle("") tlabel(01jan1983 01feb1983 
010221983 3 
0153:1983 0131121983 0131311983 0131941983 , 
grid format (%tdmd) ( 
legend(position(4) ring(0) rows(2) 
label(i "daily water use") label(2 "5-day 
average")) 
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400 
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الشكل )3.12( 


المتوسطات المتحركة تشترك مع الإحصائيات الأخرى التي تعتمد على 
المتوسط في عيب واحدء وهو أنها JÉ‏ مقاومة للقيم المتطرفة. وحيث إن القيم 
المتطرفة واضحة من الحواف المدببة البارزة في السلاسل الزمنية للمياه 
بالشكل ode!‏ لذلك فإننا قد نقوم بمحاولة استخدام طريقة تمهيد AS)‏ مقاومة 
للقيم المتطرفة. الأمر tssmooth nl‏ يقوم بتمهيد غير خطي مقاوم للقيم 
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المتطرفة à jh basan‏ ومصطلحات تم شرحها في دراسة Velleman and.‏ 
Hoaglin‏ )1981( ودراسة Velleman‏ )6(1982 فعلى سبيل المثال: 
.tssmooth nl water5r - water, smoother(5)‏ 
يتم إنشاء متغير جديد باسم waterSr‏ يحتوي على ad‏ المتغير water‏ بعد 
laa‏ بواسطة plait‏ قير Jaca dl‏ لفثرة X .4& pall ela Gd 5 Aaj‏ 
باستخدام قيم الوسيط المتعلقة بالفترات الزمنية مع مجموعة Alla‏ هانج Ma)‏ 
7( 774 للمتوسط المتحرك الموزون لفترة زمنية تساوي 3) وتقنيات أخرى 
يمكنها تحديد الرمز الأصلي لفالمان cVelleman‏ الممهّد GS pall‏ الواحد الذي 
يبدو مفيدا مع البيانات التي تتغير بسرعة يُطلق عليه “4253h, twice"‏ 
وبتطبيق هذا المُمهّد على متغير water‏ يمكننا Glas‏ المتغير الممهد -water4r‏ 


.tssmooth nl water4r = water, smoother 
(4253h, twice) 


الشكل (4.12) يعرض المتغيرات الممهدة الجديدة c waterdr‏ وبمقارنة 
الشكل (4.12) مع الشكل (3.12) نرى كيف أن الممهد 4253h, twice‏ كان 
أداؤه مقاربا للمتوسط المتحرك لفترة زمنية تساوي 5-» وبالرغم من أن كلا 
التمهيدين لهما فترات زمنية متشابهةء فإن الخيار 4253h, twice‏ قام بتخفيض 
أكثر للتباينات المدببة بالرسم. 
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الشكل )4.12( 
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ES a ee ee‏ 


في بعض الأحيان» هدفنا الرئيسي من التمهيدء هو البحث عن نمط في 
الرسم البياني للتمهيد. ومع هذه البيانات خصوصاً فإن البواقي أو قاع السلسلة 
بعد التمهيد يكون أكثر إثارة. ويمكننا أن نحسب القاع كفرق بين البيانات 
والتمهيد» ثم نقوم بتمثيل البواقي Glo‏ مع فتراتها الزمنية؛ كما فعلنا سابقاً في 
الشكل (5.12). 


generate rough = water - water4r 
.label variable rough "Residuals from 4253h, 


twice' 
-tsline rough, ttitle(") 
tlabel(01jan1983 01261983 372 01apr1983 


Olmay1983 01jun1983 01ju11983 01aug1983, grid 
format (%tdmd) ) 


4 
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الشكل )5.12( 


أقوى التقلبات في الشكل )5.12( حدثت في الفقترة ما بين 29-27 
مارس. استخدام المياه انخفض فجأة ثم ازداد مرة أخرى» وبعد ذلك عاد 
لينخفض بشكل أقل» ثم ارتفع بشكل أكبر قبل الاستقرار في مستوياته 
المعتادة. في هذه الفترة الصحف المحلية كانت تتحدث عن النفايات الكيميائية 





558 الإحصاء مع برنامج ستاتا 


الخطيرة التي تم اكتشافها في واحد من الآبار التي تقوم بتزويد القرية بالماء. 
التقارير الأولية.حذرت الناس» واتخفضن أشتيلاك مياه كل Gis gale‏ 
الأيام التالية استخدام المياه تراوح ما بين أعلى وأقل قمة في المنحنى» وذلك 
كرد فعل للتطورات الجديدة في الاستهلاك للاستخدام في الفترة الأخيرة: 
وعادت الأشياء للاستقرار من جديد بعد أن تم استبعاد البئر موضع التساؤل 
من الخدمة. 

: Opi) عن الرسومات البيانية‎ yl alioi 


Further Time Plot Examples 


البيانات الموجودة بالملف Greenlaud _temperature.dta‏ تتضمن Ala la‏ 
زمنية معروفة لتقديرات درجة الحرارة والتي تم إعادة إنشائها من GISP2‏ 
جليد جرينلاند» حيث تغطي البيانات فترة زمنية تصل إلى 50,000 سنة 
ماضية حتى سنة 1855 (دراسة Alley‏ 2004). في المنشورات العلمية عن 
هذا النوع من البيانات» يتم تمثيل الزمن باستخدام متغير age‏ الذي يستخدم 
وحدات تمثل آلاف السنوات الماضية. "الوقت الحالي" تم تعريفه بواسطة 
الباحثين في مجال الجليد بأنه يعني سنة 1950( وأحدث البيانات الموجودة 
بمتغير age‏ هي 0.095 أو 95 سنة ماضية؛ أو بعبارة أخرى هي سنة 
5. الجليد والثلوج للسنوات الأخيرة لم تكن متراكمة بما فيه الكفاية حتى 
نطبّق عليها طريقة إعادة تركيب درجة الحرارة. ولجعل بيانات مثالنا 2-8 
وضوحاً لغير المتخصصين في cela ale‏ فسوف يتم إنشاء متغير جديد 
gear aul) cá N‏ حيث يمكن قراءة هذا المتغير 'كتقويم سنوي" من 
48,000— إلى 1999« المتغير gisptemp‏ يتضمن درجات الحرارة التي تم 
إنشاوها من بيانات الجليد .GISP2‏ المتغير shutemp‏ يحتوي على متوسط 
درجات الحرارة السنوية في نفس الموقع بجزيرة جرينلاند» والتي قام العلماء 
بقياسها خلال الفترة من 1999-1987 (دراسة Shuman et al.‏ 2001(- 


euse C;\data\Greenland_temperature.dta, clear 
.describe 
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ipd‏ اسم Mn AR RR tall.‏ عور اراي a‏ کو کے 


Contains data frc- C:\data\Greenland_ternerature.éta 





obs: 1,646 Greenland ice core temp 48,020 years ago مع‎ 
1855 (Alley 2004) 
Vars: 4 2 gvl 2012 06:11 
size: 26,336 
8 ا‎ a 
storage display value 
variable name type format label variable label 
year float $5.0f 'Calendar' year 
age float $8.0g Age, 1,000s of years before 1950 
gisptemp floet $8.0g GISP2 ice core Central Greenland temp -48,000 to 
1855, C 
shutemp float %9.0g Shuman (2001) Summit temp 1987 to 1999, C 





Sorted by: year 
الحرارة‎ GLa ys الشكل )6.12( يعرض الرؤوس المدببة لبيانات‎ 
هذه الرؤوس المدببة تم إنشاؤها من مستوى أساسي يساوي المتوسط‎ .GISP2 
للأمد الطويل مع درجات الحرارة التي تكون أعلى من المتوسط والتي تم‎ 
الإشارة إليها في الرسم باستخدام رؤوس مدببة حمراء» ودرجات الحرارة‎ 
التي تكون أقل من المتوسط والتي تم الإشارة إليها في الرسم برؤوس مدببة‎ 
زرقاء. وحيث إن البيانات أكثر توافرا للسنوات الأخيرة» فإن المستوى‎ 
الأساسي المناسب لكامل السلسلة تم حسابه من متوسط فترات آلاف السنين‎ 

بدلا من متوسط القياسات الفردية. 
-gen millennium = int(year/1000)‏ 


-collapse (mean) gisptemp, by (millennium) 
-summ gisptemp 


Variable Obs Mean Std. Dev. Min Max 
gisptemp 50 ~42.75702 6.798864 -51.48554 -30.02251 


.use C:\data\Greenland_temperature.dta, clear 
¿graph twoway spike gisptemp year if gisptemp» 
~42.75702,base(-42.75702) lcolor(erose) 
|| spike gisptemp year if gisptemp«- - 
42.75702, 
base(-42.75702) 1color(eltblue) 


|| lowess gisptemp year, bwidth(.05) 
iwidth (medthick) lcolor (black) 

|| , ytitle("Central Greenland temperature, 
`=char (176) 'C") legend (off) 
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(6.12) الشكل‎ 


هذا الشكل البياني يعرض بوضوح عملية التحول من العصور الجليدية 
إلى الظروف الأكثر حرارة. درجات الحرارة في جرينلاند زادت بحوالي 20 
درجة Ay sie‏ من JÍ‏ من 50- درجة مئوية إلى حوالي 30- درجة Ag gia‏ 
هذا التحول توقف مؤقتا حيث تمت العودة من جديد للعصور الجليدية في 
الفترة التي تسمى Younger Dryas‏ والتي حدثت في الفترة ما بين 12,900 
سنة تقريباً و11,500 سنة ماضية (التقويم السنوي 10,900- إلى 9,500- 
في الرسم البياني» الرأس المدبب المنخفض الأخير)» بداية ونهاية Younger‏ 
JS Dryas‏ منها حدثت خلال عقود ALM‏ أو أقل من ذلك» دافعاً العديد من 
الدراسات لاختبار السبب المحتمل والإمكانية المستقبلية للتغير المناخي 
المفاجئ (انظر على سبيل «Stall‏ دراسة White et al.‏ 2010). 

المتوسط المتحرك أو تقنيات التمهيد غير الخطية التي تم توضيحها في 
qi‏ اسايق كل بتاكل ونيد دي SDE‏ اتی fg‏ یدیا فر ات زی 
åy gluda‏ وعندما يحدث تباين بين هذه المشاهدات في فترات زمنية قصيرة» 
فإن قياسات الجليد في 61522 بها مسافات زمنية متفاوتة بين مشاهداتهاء مما 
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يجعل الفترة الز منية بين مشاهداتها متفاوتة أكثر كلما تعمقنا أكثر (أقدم) 
جاعلاً طبقات الجليد أكثر كثافة. بالنسبة للسلاسل الزمنية مع فترات زمنية 
متفاوتة أو التي تم إجراء تمهيد لها خلال فترات زمنية طويلة أو التي لها 
انحدار لدالة تمهيد مثل المنحنى الذي يظهر في الشكل (6.12) فإنها تعتبر 
الشكل )7.12( يعرض أحدث جزء من البيانات التي تظهر في الشكل 
)6.12( واصفاً درجات الحرارة 61582 لفترة 11,000 سنة الماضية فقطء 
الأشكال البيانية المشابهة لهذا الشكل البياني الذي يعرض الزمن بيانياً كان 
{jee‏ أساسياً لعدم الوضوخ: 

-graph twoway line gisptemp year if year» - 

9000,1width(medthick) 

xlabel(-9000(1000)2000, grid gmax gmin) 

title("Greenland ice core only") 


ytitle("Central Greenland temperature, 
`=char (176) 'C") 
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الشكل )7.12( 
يمكننا أن نرى أن العديد من قيم التباين الخادعة في الشكل )7.12( حيث 
إن نقطة البيانات النهائية (الواقعية 1855) تم توصيفها بأنها SII‏ وإذا 
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كانت هذه النقطة تمثل درجة الحرارة الواقعيةء فإننا قد نعتقد بأن جرينلائند 
مازالت أكثر برودة من المتوسط مقارنة ب 10,000 سنة الماضيةء وأن 
الارتفاع الذي حدث أخيراً في درجات الحرارة كان غير ملحوظ وهذه هي 
النقطة التي حاول هذا الشكل إظهارها. البعض حاول استخدام طريقة الرسم 
البياني باستخدام خط أساسي مشابه لما قمنا به في الشكل (6.12) ولكن تم 
تحديد 1855 على أنها نقطة النهاية للخط الأساسيء وذلك لجعل"البرد الآن" 
وسالة أكثل وكبوحا. المتغيرات الأخرى تخفي حقيقة أن درجات الحرارة في 
جرينلاند ليست درجات الحرارة العالمية. 

في 1855 عموماء فإن درجات الحرارة في جرينلاند كانت da ji‏ يدرجة 
بسيطة fa‏ من فترة برودة يُطلق عليها العصر الجليدي البسيط. درجات 
الحرارة الحديثة أكثر lids‏ وهذا أدى إلى انخفاض في كتلة الغطاء الجليديء 
كما أدى إلى انخفاض في جليد البحر حول الساحل. حتى في فترة التسعينيات 
القياسات المباشرة من قمة الغطاء الجليدي توضح أن متوسط درجة الحرارة 
السنوية هو 29.26- درجة مئوية (دراسة Shuman et al.‏ 2001(« الشكل 
)812( ذه رم dus Lo‏ ولكن مخ تفلا TENE Aig neg‏ 
درجات الحرارة 5 ما بين 1999-1987 يتم تركيبها كنقطة à‏ في الرسم 
البياني. . هناك خطان من النصوص تم وضعهما في المركز عند محور بر عند 
س 28.80«( وعند التوصيف 1500 بالمحور الأفقي x‏ وبنفس 


.graph twoway line gisptemp year, 
1lwidth (medthick) 
|| scatter shutemp year, msymbol (sS) 
mcolor (red) 


|| i£ year >- 9000,xlabel(-9000(1000)2000, 
grid gmax gmin) 

title("Greenland ice core compared with 

recent") legend(of£) 

ytitle("Central Greenland temperature, 

`=char (176) 'C") 

text(-28.80 1500 "1987°=char(i50)'" "1999", 

color (red) ( 
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الشكل )8.12( يترك انطباعاً مختلفاً عن الانطباع الذي يتركه الشكل 
)7.12(« بالرغم من أن بيانات الجليد المستخدمة في كلا الشكلين هي نفسها. 


Recent Climate Change : التغيرات الأخيرة & اطناخ‎ 


سوف ننقل تركيزنا على وحدات القياس من آلاف السنوات إلى RADE‏ 
سنة ماضية فقط. بقية هذا الفصل؛ سوف تركز على التغيرات التي حدثت في 
المناخ خلال السنوات الأخيرة. ملف البيانات Climate.dta‏ يحتوي على ثلاث 
سلاسل زمنية تقوم بتقدير درجات الحرارة العالمية الشهرية في الفترة مسن 
0 وحتى 2010( مع أربعة محركات أو أسباب محتملة لدرجات 
الحرارة؛ اثنان من مؤشرات درجات الحرارة يتم استخراجهما من قياسات 
درجة حرارة السطح (NCDC y NASA)‏ بينما المؤشر GIL‏ يقوم بتقدير 
درجات الحرارة من طبقة التربوسفير السفلية والتي تم الحصول عليها مسن 
بيانات الأقمار (UAH) lad‏ انظر إلى Gale‏ مصادر البيانات لمزيد من 
المعلومات عن كل هذه المتغيرات والتي تم جمعها lea‏ من مصادر مختلفة. 


.use C:\data\Climate.dta, clear 
.describe 
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Contains data from C:\data\Climate.dta 








obs: 372 Global temperature & drivers 1980-2010 
vars: 11 2 Jul 2012 06:11 

size: 13,764 

storage display value 

variable name type format label variable label 
year int $9.0g Year 
month byte %9.0g Month 
myear int StmmCY Month, year 
nedctemp float %9.0g NCDC global temp anomaly v.1901-2000, C 
nasatemp float $8.09 NASA global temp anomaly v.1951-1980, C 
uahtemp float %9.0g UAH global temp anomaly v.1981-2010, C 
aod float 09 Aerosol Optical Depth at 550nm 
tsil float %8.0g Total Solar Irradiance, W/m2 
mei float %9.0g Multivariate ENSO Index 
co2globe float %8.0g Global average marine surface CO2, ppm 
co2anor float %9.0g Global CO2 anomaly, ppm 





Sorted by: myear 


الفترة الزمنية 2010-1980 تم تغطيها بالبيانات الموجودة بالملف 
764 وهي محددة بالبيانات التي تم الحصول عليها للدراسة وتتضمن: 
سلسلة زمنية لمتوسط مستويات ثاني أكسيد الكربون تم استخدامها هنا من بداية 
ài.‏ 1980« وبيانات العمق البصري للهباء الجوي Aerosol Optical Depth‏ 
والتي تم تحديثها حتى سنة 2010 بيانات هذا الملف تم تحديدها كبيانات 
سلاسل زمنية باستخدام الأمر وا المتغير myear‏ كمتغير Ju‏ 
الزمن» وهو متغير يحتوي على بيانات شهرية تم تعريفها من خلال فصل 
month sal‏ والمتغير year‏ والتي كانت موجودة في البيانات الأصلية. 
وداخليا يقوم برنامج ستاتا بتعريف المتغيرات الشهرية كرقم لعدد الأشهر منذ 
يناير 1960 بنفس الطريقة التي تم بها تعريف متغيرات التاريخ كرقم لعدد 
الأيام منذ 1 يناير 1960ء هنا المتغير myear‏ له تنسيق YotmmCY‏ حتى يظهر 
لنا Feb «1980 Jan‏ 1980 وهكذا. إذا لم يتم القيام بإجراء هذا التنسيق مسبقاً فإن 
إنشاء هذا المتغير الشهريء وتحديد البيانات كبيانات سلاسل زمنية باك تخدام 
الأمر ctsset‏ هي خطوات ضرورية للقيام بأي تحليل لاحقاً. 


.gen myear - ym(year, month) 
.format myear %tmmCY 


.label variable myear "Month, year' 
.tsset myear 
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في ورقة بحثية تم استخدامها كمرجع من قبل كثير من الدراسات» 
قام كل من Rahmstorf 5 Foster‏ 2011 (بناءً على عمل سابق من قبل 
Lean and Rind,‏ 2008( بتحليل درجات حرارة مشابهة» ومتغيرات قيادية 
للكشف عن "الإشارات الحقيفية لظاهرة الاحتباس الحراري العالمي' التحليل 
الذي قاموا به ASÍ‏ دقة من الأمثلة البسيطة الموجودة في هذا الفصل مع 
وصولنا لنتائج متشابهة في العموم. 

الشكل (9.12) يعرض درجات الحرارة العالمية الشاذة حسب مؤشر مركز 
بيانات المناخ الوطني (NCDC)‏ والتي تظهر في المتغير «nedetemp‏ درجات 
الحرارة الشاذة من محطة أرصاد جوية تمثل انحرافات عن درجة الحرارة 
المشاهدة من متوسط درجات الحرارة في الأمد الطويل في محطة الأرصاد تلك؛ 
درجات الحرارة الشاذة العالمية بالتالي تم حسابها من متوسط موزون للعديد من 
درجات الحرارة الشاذة في العديد من محطات الأرصاد حول العالم؛ الخفط 
الرمادي عند درجة الحرارة صفر يمثل متوسط القرن العشرين. 

.tsline ncdctemp, lw(medthick) 
ytitle("Global temperature anomaly vs. 
1901°=char(150)'2000, 
`=char (176) 'C", size(medsmall)) 
yline(0, 1color(gs12) lwidth(thick) ) 


xtitle("") 
xlabel(, grid gmin gmax) 
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كل الأشهر ماعدا شهرين في الشكل (9.12) لها درجات حرارة أعلى 
من متوسط درجات الحرارة في القرن العشرين. ظاهرة الاحتباس الحراري 
شهدت VOCENT Y‏ السبعينيات» وهي الفترة التي تم تمثيلها 
بيانياً في هذا الشكل» والنقطة المركزية العليا في هذا الشكل وهو الشهر الذي 
شهد أعلى درجات حرارة عالمياً في فبراير 1998 لم يتم تجاوزها (ثم تم 
الوصول إليها تقريباً) حتى يناير 2007. كلتا النقطتين أكثرمن الانحرافات 
المعيارية للاثنين» وأعلى من أي شهر قبل سنة 1980 في بيانات NCDC‏ 
والتي تعود إلى سنة 1880 (انظر الشكل 1.2 في Jail‏ | لثاني)؛ وعموماً 
فإن درجات الحرارة المرتفعة خلال فترة زمنية كبيرة من سنة 1998 مع 
درجات الحرارة المنخفضة خلال العقد الماضي تشكل انطباعاً واضحاً بأن 
الاحتباس الحراري قد يكون قد توقف مؤقتاً خلال العقد الماضي. الجزء 
الأخير من هذا الفصلء يقوم بتطبيق نماذج السلاسل الزمنية لاختبار 
التفسيرات المحتملة. 

إذا كانت هناك أسباب تنظيمية» فإنها فد توجد بين المتغيرات الأخرى 
في بيانات .Climate.dta‏ هذه تتضمن أربعة عوامل تم تحديدها بواسطة علماء 
الطبيعة كعوامل مهمة تسبب أو تؤثر على تباين درجة حرارة الهواء. وحيث 
إن عدم صفاء الجو والتي تقاس هنا بواسطة العمق البصري للهباء الجوي 
(AOD)‏ عند طول موجي 550nm‏ وهذا يعكس تأثير ثورات البراكين والتي 
تجعل درجة حرارة السطح أكثر برودة» وذلك من خلال إضافة أشعة ضوء 
الشمس التي تحجزه البراكين المرتفعة في الجو (دراسة Sato et al.‏ 1993). 
الخفوت الشمسي الكلي Total Solar Irradiance (TSI)‏ يتضمن قياسات تعتمد 
على LAY)‏ الصناعية للكمية المتذبذبة من أشعة الشمس JS! ca stu ust)‏ 
متر مربع) الذي يسطع عند الطبةات العلوية للغلاف الجوي للأرض (دراسة 
Frohlich‏ 2006(« وحدوث ظاهرة إلنينو/ التذبذب الجنوبي (ENSO)‏ يمكن أن 
تكون لها تأثيرات جوهرية على درجات حرارة الهواء العالميةء كما أن 
الهواء الساخن الذي يحدث أثناء تغيرات الجو ويساهم في تسخين سطح الماء 
في مركز وشرق المنطقة الاستوائية بالمحيط الهادئ (إلنينو (El. Nino‏ أو 
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درجات الهواء الباردء والذي يقوم بدفع مياه المحيط العميقة إلى السطح Y)‏ 
نينا «(La Nina‏ بعض مؤشرات "T ENSO‏ من خلال درجات حرارة سطح 
البحرء وتؤدي إلى إنشاء تيارات مداريةء وتستخدم هذه لاحقا لتفسير درجة 
الحرارة. ومن ناحية أخرىء فإن مؤشر ENSO‏ المتعدد (MEI)‏ يتم تعريفه من 
خلال المكون الرئيس الأول للمتغيرات 6 التي تم مشاهدتها في المنطقة 
الاستوائية بالمحيط الهادئ وهي: ضغط مستوى سطح البحرء المكونات 
الطولية والعرضية للرياح السطحية» درجة حرارة سطح البحرء درجة 
حرارة هواء السطح» والجزء المُغْيّمَ الكلي من السماء؛ قيم MEI‏ التي تكون 
أعلى من الصفر بدرجة جوهرية تشير إلى حالة إلنينوء Gio‏ القيم التي تكون 
أقل من الصفر تشير إلى لانينا (دراسة Wolter and Timlin‏ 1998(« المحرك 
الرابع في هذه البيانات هو المتوسط العالمي لتركيز ثاني أكسيد الكربون 
لسطح البحرء oui,‏ بأجزاء من المليون ELL‏ على قياسات من شبكة المواقع 
الجغرافية المختلفة )23 Masarie and Tans 4u!‏ 1995(« المتغير co2globe‏ 
يعطي التركيز الفعلي لثاني أكسيد الكربون» والمتغير co2anom.‏ يقوم بإزالة 
التباينات الموسمية» وذلك من خلال طرحها من كل قيمة للمتوسط العالمي 
لذلك الشهر في الفترة 2010-1980. 

الشكل )10.12( يقوم بدمج الرسومات البيانية للزمن لأربع سلاسل 
رئيسة خلال نفس السنوات التي تم تمثيلها في الشكل )9.12( الرسم البياني 
ل AOD‏ في أعلى اليسار له نمط مثير للانتباهء وتم التأثير عليه بواسطة 
اثنتين من الثورات البركانية الكبيرة: الأولى الشيكنو El Chichón‏ في المكسيك 
في نهاية مارس 1982ء 5 A01‏ بجبل بيناتوبو Mount Pinatubo‏ في الفلبين 
في يونيو 1991. كما أن TSI‏ يتحرك بشكل متساسل» ولكن هذا التسلسل 
تمت مقاطعته فجأة بواسطة رؤوس مدببة مرتفعة ومنخفضة. ثم كانت الفترة 
الأخيرة مستقرة إلى حد كبير. بالنسبة ل MEI‏ فلم يكن متسلسلاً بالرغم من 
مظهره المتذبذب مع فترات غير منتظمة بين الأوضاع الإيجابية والسلبية» 
عدم الانتظام واحتمال حصول تغيرات سريعة يجعل إلينيو ولانينا أحداثا 
صعبة cas sill‏ بالرغم من تأثيراتها الكبيرة على الناس؛ مما يجعل التنبؤ بها 
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هدف مهم جداً. كما أن تركيز ثاني أكسيد الكربون كان سهل التوقع» لأنه في 
ارتفاع مستمر بزيادة قدرها 5 بليون طن. حيت إنه يزداد في الهواء الجوي 
كل سنة نتيجة أنشطة بشرية. 
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آخر جزء في هذا الفصلء قام باختبار كيف أن هذه المتغيرات الأربعة 
معاً تشرح التغيرات الأخيرة في درجات الحرارة؛ ونتابع هذا التحليل في 
الجزء التالي الذي سوف يتطرق إلى المفاهيم الأساسية والأدوات. 
gbl olds‏ والسوابف والفروقات : 

Lags, Leads and Differences 

تحليل السلاسل الزمنية في ball‏ يتضمن متغيرات لها فترات تباطو أو 
قيم من فترات ماضية. فترات التباطؤ يمكن تحديدها بواسطة الأقواس. فمثلا 
الأمر أدناه يقوم بإنشاء متغير جديد باسم 7 ghg mei‏ يساوي القيم السابقة 
لمؤشر ENSO‏ التراكمي: 


.generate mei 1 = mei[_n-1] 
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أو هناك طريقة أخرى يمكننا استخدامها للقيام بنفس العملية» وذلك من 

خلال الأمر tsset‏ مع المحدد .1 (فترة التباطؤ). فاستخدام محددات فترات 

التباطؤ أفضل من استخدام طريقة الأقواس. والشيء المهم fas,‏ أن استخدام 

محدد فترة التباطؤ يأخذ في الاعتبار البيانات الطولية cPanel Data‏ الأمر أدناه 
يقوم بإنشاء قيم تباطؤ لمدة شهر 1- و2- للمتغير ei‏ 

generate —— - Li.mei 

label variable mei 1 "MEI 1-month lag" 

.generate mei 2 - L2.mei 

.label variable mei 2 "MEI 2-month lag' 

.list year month mei mei 1 mei 2 in -5/1 


year month 


368. 
369. 
370. 
3v. 
372. 





كما يمكننا الحصول على نفس القائمة» وذلك من خلال إنشاء متغيرات 
جديدة عن طريق طباعة الأمر: 
-list year month mei L1.mei L2.mei in -5/1‏ 


المحدد .1 هو أحد الأدوات التي تسل العمل مع بيانات السلاسل 
الزمنيةء حيث هناك محددات أخرى هي F.‏ (لاحقة)» D.‏ (الفرق)ء Guill) s.‏ 
(asa gall‏ کد یکت وکن اسا کر ف سف ETE‏ - 
F2.mei‏ هو 4.3 -f2.mei‏ 


Time Series Operators : محددات السلاسل الزمنية‎ 


L.‏ فترة تباطؤ ,بر L1.)‏ يعني ü‏ نفس الشيء). 
L2.‏ فترتا تباطؤ يبر (وبالمثل .13 وهكذاء .(1)1/4 تعني فترات تباطؤ من Ll.‏ 
وحتى .14). 
F,‏ فترة لاحقة ,رر FL)‏ تعني نفسي الشيء). 
F2.‏ فترتان لاحقتان :بير (و بالمثل .۴3 وهكذا). 
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D.‏ الفرق بين الفترة الحالية والفترة السابقة ,,بر-,بر D1.)‏ تعني نفس الشيء). 

D2.‏ فرق الدرجة الثانية Oriya)‏ -(بر-,بن (وبالمثل D3.‏ وهكذا). 

(D. الفرق الموسمي ,بر بر (وهو نفسه الفرق الناتج من‎ S. 

الفرق الموسمي الثاني )9,52 (وبالمثل S3.‏ وهكذا). 

في حالة الفروقات الموسميةء فإن المحدد S12‏ لا يعني الاختلاف الثاني 
عشرء ولكنه الاختلاف الأول عند فترة تباطؤ 12 . فعلى سبيل «Ja‏ إذا 
كانت لدينا قيم فعلية لثاني أكسيد الكربون CO,‏ العالمية فقط Ya‏ من القيم 
الشاذة؛ فإنه بالإمكان أن نرى نمطا موسمياً واضحاً منخفضاً في أغسطس 
وسبتمبر» ولبعض الأسباب قد نحتاج إلى حساب 512.602 والذي قد يكون هو 
الاختلافات بين يناير 1980 co2‏ ويناير 1981 «co2‏ وكذلك بين فبراير 
co2 1980‏ وفبراير 1981 co2‏ وهكذا. 

محددات فترات التباطؤ يمكن أن تظهر مباشرة في أغلب أوامر التحليل 
التي تتضمن بيانات toset‏ المثال أدناه يقوم بحساب انحدار درجات الحرارة 
العالمية (nedetemp)‏ على مؤشر العمق البصري للشهر الماضي (aod)‏ والذي 
يُفترض ee‏ أن يزيد تأثير البرودة. الانحدار تم حسابه بدون الحاجة إلى 


إنشاء أي متغيرات تباطؤ جديدة. 
.regress ncdctemp L1.aod‏ 





Source SS df MS Number of obs - 371 

F( 1, 369) = 54.92 

Model 1.7221338 1 1.7221338 Prob > F = 0.0000 

Residual 11.5699674 369 .031354925 R-squared =, 0.12596 

Adj R-squared = 0.1272‏ إل 

Total 13.2921012 370 .035924598 Root MSE =i „17107 

ncdctemp Coef. Std. Err. E P>|t| (95% Conf. Interval] 
aod 

Li. -2.313292 .3121404 -7.41 0.000 -2.92709 -1.699495 


_cons .4361341 .0105842 41.21 0.000 .4153213 .456947 
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وكما هو ab gia‏ فإن متغير aod‏ له تأثير سالب على درجات الحرارة 
العالمية» والنموذج الذي تم تقديره يتضمن درجات حرارة شهرية كدالة لقيم 
aod‏ للشهر الماضي: 

ncdctemp, = 0.436 - 313604‏ المتوقعة 

معامل المتغير المتباطئ (2.313-)20 يظهر ذو معنوية إحصائية )0.000 (p=‏ 
ولكن الأخطاء المعيارية» واختبارات الانحدار قد لا تكون صالحة» وكما هو 
معتاد مع أي نموذج OLS‏ فإنه يعتمد على فرضية أن أخطاء المشاهدات المتعاقبة 
هي أخطاء مستقلة أو غير مترابطة مع بعضهاء الأخطاء المترابطة تحدث في 
العادة في تحليل السلاسل الزمنية. ولذلك فإننا نقوم بشكل روتيني باختبار وجودها 
كما سوف يتم فعله في الجزء التالي. الأخطاء المعيارية وفترات الثقة واختبارات 
الانحدار 5 التي ند تتضمن سلاسل زمنية يجب النظر إليها بنوع ya‏ الشك مالم 
تظهر الاختبارات بأنه ليس هناك دليل على وجود الأخطاء المترابطة. 

بالرغم من احتمالية أن الأخطاء المترابطة تجعل اختبارات F‏ و من هذا 
الانحدار غير موثوقةء فإن Aldea‏ الانحدار نفسها يمكن أن تعطينا وصفا 
صحيحاً للمربعات الصغرى للبيانات» الشكل (11.12) يعرض: القيم المتوقعة 
مع Gls ja‏ الحرارة cias al‏ ثورة بركان Pinatubo‏ الضخمة ae‏ سنة 
1 توقعت انخفاضاً les‏ في d aie,»‏ ولتي تظهر في بدا 
ja‏ يعات eh al‏ . ومن الواضح أن هناك الكة ا Lec‏ 

ثيرها على المنا العالمي. 
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سوف نستمر في التحليل الوصفي» حيث يمكننا اكتشاف ما إذا كانت 
محركات درجات الحرارة المقترحة في هذه البيانات تتطور حتى تتناسب مع 
درجات الحرارة المشاهدة. وبتضمين أشعة الشمس مع فترة تباطؤ كمتغير 
تنبؤي 95( فإن ذلك يزيد من قيمة RÀ,‏ زيادة بسيطة من 0.127 إلى 0.144« 
ويظهر معامل متغير أشعة الشمس التباطؤية سالباًء وهذا ليس له أي معنى 


.regress ncdctemp L1.aod Li.tsil 








Source 










Number of obs - 371 

F( 2, 368) 32.22 

Model 1.98067563 2 .990337816 Prob» F - 0.0000 
Residual 11.3114256 8 .03073757 R-squared - 0.1490 
Adj R-squared = 0.1444 

13.2921012 370 .035924598 Root MSE = .17532 


















ncdctemp Coef. Std. Err. t P»|t| [95$ Conf. Interval] 


٠ 

L1. -2.172641 <2 -6.95 0.000 -2.787808 -1.557474 
tsil 

Ll. -.0598584  .0206393 -2.90 0,004 -.1004441 -.0192727 


82.19402 28.19026 2.92 





0.004 26.75982 





137.6282 





إضافة متغير تنبؤي تباطؤي ثالث وهو مؤشر ENSO‏ المتعدد يزيد من 
قدرة النموذج على شرح التباين 0.201 = (R^,‏ معامل المتغير Llanei‏ موجب 
ويُقترض أن يُعطي تأثيرا حرارياً معروفاً لإلينوي. سوف نرى Leal‏ معامل 

Li tsi] سالب غير معقول للمتغير‎ 
.regress ncdctemp L1.aod L1.tsil L1.mei 
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55 








Source ss df MS Number of obs - 371 
F( 3, 367) = 32.00 

Model 2.75629902 3 .918766339 Prob » F - 0.0000 
Residual 10.5358022 367 .028707908 R-squared - 0.2074 
Adj R-squared = 0.2009 

Total 13.2921012 370 .035924598 Root MSE = .16943 


ncdctemp Coef. Std. Err. 8 P>|t| [95$ Conf. Interval 


th 
aod 

L1. -2.949131 3372229 -8.75 0.000 -3.612262 -2.285999 
tsil 

L1. -.05509 .0199673 -2.76 0.006 -.0943546 -.0158253 
mei 

Ll. - 0524371 . 0100882 5.20 0,000 .0325991 .072275 

cons 75.67739 27.27247 2,77 0.006 22.04748 129.3073 








التطور الملحوظ في ,8 حدث عندما قمنا بإضافة القيم الشاذة — CO,‏ 
إلى المتغيرات التنبؤية. هذه المتغيرات الأربعة ina‏ تشرح حوالي %72.7 
من التباين في درجات الحرارة الشهرية. القيم الشاذة ل CO;‏ لها حتى الآن 
أقوى تأثير في الاتجاه الموجب كما هو متوقع من طبيعة الغازات المسببة 
للاحتباس الحراري. فعندما نتحكم في «CO,‏ فإن معامل أشعة ضوء الشمس 
تصبح موجبة أيضا. 











y 3 
.regress ncdctemp L1.aod L1.tsil1 L1.mei 
L1.co2anom 
Source 55 af MS Number of obs - 371 
F( 4, 366) = 247.57 
Model 9.70518563 4 2401 Prob > F - 0.0000 
Residual 3.58691559 366 .009800316 R-squared - 0.7301 
Adj R-squared = 0.7272 
Total 13.2921012 370 .035924598 Root MSE - .099 
ncdctemp Coef. Std. Err. i P-]|t| [95$ Conf. Interval] 
aod 
L1. -1.535808 -2040555 -7.53 0.000 -1.937077 -1.13454 
tsil 
L1 .0882862 .012849 6.87 0.000 .0630189 21135534 
mei 
L1 . 0689124 .0059267 11.63 0.000 .0572578 .0805671 
co2anom 
L1. -0109831 -0004125 26.63 0.000 .010172 -0117942 
-cons -120.1742 17.55028 -6.85 0.000 -154.6862 -85.66217 
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الشكل )12.12( يعرض تطوراً 48 للنماذج الأربعة. القيم المتوقعة في 
في الجانب الأسفل الأيمن وهي التي ظهرت بناءً على انحدار كل المتغيرات 
الأربعة الرئيسة يعرض درجات الحرارة المشاهدة بطريقة digs‏ حيسث 
يتضمن تفاصيل Sie‏ البرودة بعد ثورة بركان Pinatubo‏ وارتفاع درجة 
الحرارة خلال فترة "إلنينو الفائق" لسنة 1998 والمسار المتحرك للعقد 
الماضي» والذي انخفضت درجة حرارته بسبب انخفاض أشعة الشمس 
والانخفاض الكبير إلى سالب ENSO‏ التناسب بين درجات الحرارة المتوقعة 
والمشاهدة واضح جد Cole cli il GY‏ من كموةج lacs. dana‏ جميع 
تأثيراته كانت خطية وكانت متغيراته مع فترة تباطؤ لشهر واحد فقط. 


3 
Volcanoes Volcanoes, solar 
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Global temperature anomaly vs. 1901-2000. °C 





نماذج المناخ العالمي» والتي تعتمد على الطبيعة بدلا من الإحصاء 
تتضمن العديد من المتغيرات» والعديد من التعقيدات الجغرافية المتنوعة والتى 
قد تحتاج إلى أسابيع لمعالجتها بأجهزة كمبيوتر ذات إمكانات ضخمة جدا. 
النتائج المعروضة في الشكل )12.12( توضح ob‏ مثل هذا النموذج البسيط 


يعمل بقدر إمكاناته dua! andae LV ED‏ هذه المحتدات هدو مخسدد 
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إحصائي: حيث إن الأخطاء المعيارية ل OLS‏ متحيّزة:؛ واختبارات t5 F‏ 
تكون غير dalle‏ في حالة حدوث ترابط بين هذه الأخطاء. asf‏ الفحوصات 
البسيطة للأخطاء المترابطة يُسمى اختبار دربن واتسون Durbin-Watson‏ 
والذي يمكن استخدامه بعد أي انحدار. 
.estat dwatson‏ 
Durbin-Watson d-statistic(5, 371)= 1.131453‏ 
كتب الإحصاء تحتوي على جداول للقيم الحرجة لاختبار دربن واتسون؛ 
وإذا أخذنا 5 معلمات مقدّرة (4 متغيرات تنبؤية وتقاطع (y‏ و371 مشاهدة 
فإن القيم الحرجة تقريباً هي 159 -.4 و 1.76 edy‏ إحصائية الاختبار تحت 
9 - 4 تقود إلى رفض فرضية العدم» بأن هناك ارتباطا ذاتيا موجبا (فترة 
تباطؤ 1) من الدرجة الأولى. ولأن الإحصائية المحسوبة 1 أقل من 
9 = 4» فإننا يجب أن نرفض فرضية العدم ونستنتج بدلا من ذلك أن هناك 
Gaga Già Lela‏ مق الدرجة LL AI‏ هذه النتنجة توكد AAW) ad SAN‏ 
حول مدى صلاحية اختبارات في نماذج OLS‏ لدرجات الحرارة. 
لو كانت الإحصائية المحسوبة أكبر من 1.76 dy‏ لفشلنا في رفض 
فرضية العدم؛ ولم يكن لدينا أي دليل على أن الارتباط الذاتي ذو معنوية. 
إحصائيات دربن واتسون المحسوبة بين d,‏ و dy‏ فهذا يعني Ud‏ لانستطيع 
رفض أو قبول فرضية Ho pall‏ 
إحصائية دربن واتسون تختبر الارتباط الذاتي مسن الدرجة الأولسى» 
وتأخذ في الاعتبار الفرضيات البديلة الإيجابية فقط. وفي الواقع العملي» فإن 
الارتباط الذاتي يمكن أن يكون سالباً أو chaga‏ ويمكن أن يحدث عند قترات 
تباطؤ أخرى غير 1. الجزء التالي يعرض بشكل أكشر تفصيلاً أدوات 
التشخيص العامة. i‏ 
التمثيل cu‏ للارتباط : Correlograms‏ 


مُعاملات الارتباط الذاتي SS‏ الارتباط بين متغير ما ونفسه عند فترات 
تباطؤ معينة» فمثلاً الارتباط الذاتي من الدرجة الأولى هو الارتباط بين بر 
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وبر Ul‏ الدرجة الثانية فهي تشير إلى الارتباط بين ]2 , [y‏ وهكذا. التمثيل 
البياني للارتباط يعرض تمثيلاً بيانياً للارتباط مقابل فترة التباطؤ. 

الأمر corrgram‏ يعطي [M ER Jia‏ للارتباط مع المعلومات ذات 
العلاقة» أقصى aac‏ لفترات التباطؤٌ التي يتم عرضها يمكن أن dins‏ محذودا 
نتيجة البيانات» وذلك باستخدام الخيار omatsize‏ أو بعض الأرقام المنخفضة 
العشو ائيةء والتي يتم تحديدها باستخدام الخيار ()وع12: 


.corrgram mei, lags(13) 


-1 0 A of 0 1 
LAG AC PAC Q Prob»Q [Autocorrelation] [Partial Autocor] 
1 0.9473 0.9569 336.5 0.0000 
2 0.8582 -0.4181 613.45 0.0000 
3 0.7532 -0.0631 827.33 0.0000 
4 0.6350 -0.1578 979.77 0.0000 
5 0.5167 0.0033 1081 0.0000 
6 0.4036 -0.0680 1142.9 0.0000 
7 0.2983 -0.0299 1176.8 0.0000 
8 0.2060 -0.0235 1193 0.0000 
9 0.1224 -0.0393 1198.8 0.0000 
10 0.0499 -0.0185 1199.7 0.0000 
11 -0.0140 -0.0359 1199.8 0.0000 
12 -0.0723 -0.0340 1201.8 0.0000 
13 -0.1243 -0.0456 1207.8 0.0000 


فترات التباطؤ تظهر في الجانب الأيسر من الجدول يليها قيم الارتباط 
الذاتي (AC)‏ والارتباط الذاتي الجزئي fad (PAC)‏ الارتباط بين mei,‏ 
meins‏ هو 0.8582 بينما الارتباط الذاتي الجزئي (المعدل لفترة تباطو 1) 
هو 70.4181« إحصائيات O‏ (إحصائية (Ljung-Box‏ تختبر سلسلة من 
فرضيات العدم التي بها الارتباطات الذاتية تتضمن فترة تباطو تساوي 
صفراء وحيث إن قيم الاحتمال p-values‏ التي نراها هنا كلها صغيرة das‏ 
فيجب Lyle‏ رفض فرضيات padl‏ ونستنتج من ذلك بأن مؤشر ENSO‏ 
التراكمي (mei)‏ يوضح Lod als J‏ ذا معنوية؛ وإذا وجدنا ado‏ لا توجد أي 
قيمة احتمال لإحصائية © أقل 0.05 فإنه يمكننا الاستنتاج بأن السلسلة كانت 
ذات ضجة بيضاء white noise‏ مع ارتباط ذاتي ليس ذا معنوية. 
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لقصل الي ج و Más tl‏ ا 
في الجانب Ga!‏ لمخرجات جدول الأمر Cus corrgram‏ إن هذا الجدول 
Xa‏ بخطوط بيانية توضح الارتباطات الذاتية» والارتباطات الذاتية dál‏ 
فحص مثل هذه الخطوط البيانية يلعب دورا في اختيار نماذج السلاسل Apis jl‏ 
فالتمثيل البياني للارتباط الذاتي يمكن الحصول عليه من خلال الأمر rac‏ 
.ac mei, lags(25)‏ 
الشكل )13.12( يتضمن منطقة مظللة مع نقطة تمركز مع فقرة ثفة 
5 الارتباطات خارج منطقة الثقة ذات معنوية إحصائيةء الخيار lags(25)‏ 
يوسّع هذا الشكل البياني إلى فترة تباطؤ 25 شهرًا موضحا أن الارتباطات 
الذاتية للمتغير mei‏ أصبحت سالبة بعد حوالي 12 شهراء هذا hail‏ يعكس 
خاصية شبه متذبذبة ل :ENSO‏ حيث إن الفترات العليا تميل لتكون متبوعة 
بفترات أقل وهكذا. 
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وبالمثلء فإن الأمر pac‏ يقوم بإنشاء رسم بياني للارتباطات الذاتية 
الجزئية في الشكل (14.12). فترات Ag)‏ التقريبية تقوم lis‏ على تقديرات 
Ta‏ المعيارئ ال ^ الارتباطات الذاتية الجزئية للمتغير mei‏ تختلدف 
عن الارتباطات KEN‏ حيث إنها تقطع أغلب القيم التي ليست ذات معنوية 

بعد فترة تباطؤ تساوي شهرين. 
.pac mei, lags(25)‏ 
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التمثيل البياني المتقاطع للارتباط الذاتي يساعد في اكتشاف العلاقة بين 
انين من السلاسل الزمنيةء الشكل )15.12( يعرض شكلا بيانيا متقاطعا 
للمجموع الكلي لأشعة الشمس anei s (sil)‏ التمثيل البياني المتقاطع للارتباط 
الذاتي يقترب من الصفر لفترات التباطؤ السالبة ثم ب يصبح ASÍ‏ قوة تدريجياً 
[CN WA RIP TR peru‏ 


.xcorr tsil mei, lags(25) xline(0) xlabel(- 
25(5)25) 


Cross-correlogram 
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التمثيل البياني المتقاطع للارتباط الذاتي هو طريقة سهلة fas‏ للقراءة إذا 
قمنا بوضع قائمة للمدخلات أو أول متغير مستقل في الأمر xcorr‏ 
والمخرجات أو ثاني متغير تابع كما تم القيام به في الشكل )15.12(« يليها 
فترات تباطؤ موجبة تشير إلى ارتباطات بين مدخلات عند الزمن t‏ 
ومخرجات عند الزمن 1+» H2‏ وهكذا. في هذا الشكل نرى بعض الارتباط 
بين أشعة الشمس وحالة ENSO‏ حول سنتين لاحقاً ومعتدلاً بثبات» وهذا يؤدي 
S‏ تأخير تأثير الشمس على ENSO‏ ليس هناك ارتباط بين أشعة الشمس 
وحالة ENSO‏ خلال سنتين سابقتين ولا يعطي (بدرجة معقولة) أي سبب 
للتفكير بأن ENSO‏ يؤثر على الشمس. 

مُعَاملات الارتباط المتقاطع» والإصدار النصي للتمثيل البياني للارتباط 
المتقاطع يمكن الحصول عليه باستخدام الخيار itable‏ 


.xcorr tsil mei, lags(13) table 


-1 0 $ 
LAG CORR [Cross-correlation] 





-13 -0.0308 
-12 -0.0370 
-4T -0.0434 
-10 -0.0372 
29 -0.0275 
-8 -0.0209 
-0.0062 
.0038 
.0093 
.0156 
.0262 
.0343 
.0355 
.0326 
.0340 
.0427 
.0466 
.0468 
.0441 
.0476 
.0558 
.0721 
.0849 
.0930 
.1008 
.1041 
.1142 


Oocoococoocooooooooooooo 


580 الإحصاء مع برنامج ستاتا 





بقية هذا الفصل تتحدث عما بعد الارتباط لتتناول نماذج زمنية أكثر. 
ماذخ ARIMA Models : (ARIMA)‏ 

نماذج المتوسط المتحرك للانحدار الذاتي التكاملي Autoregressive‏ 
(ARIMA) integrated moving average‏ يمكن نقديرها من خلال الأمر carima‏ 
هذا الأمر يتضمن الانحدار الذاتي Í (AR)‏ و المتوسط المتحرك (MA)‏ أو 
«ARIMA pe‏ كما يمكن تقدير النماذج الهيكلية التي تتضمن EA‏ تنبؤياً 


أو أكثر› كما تتضمن أخطاء ARIMA‏ وهي تسمى نماذج ARMAX‏ وتكون 
yo xe pi [1.12]‏ 


حيث إن بر موجه قيم المتغير التابع عند الزمن » x.‏ مصفوفة قيم 
المتغيرات التنبؤية الخارجية (وتتضمن في العادة (OÈ‏ وير هو موجّه 
الأخطاء Je‏ الأشياء الأخر ى" هذه الأخطاء يمكن أن تكون انحدارا! ذاتياً أو 
Wasa‏ رگا من أي Sou iia s‏ أخطاء ARMA(I,1)‏ هي: 

My = Ply FO رت‎ FE [2.12] 

حيث إن م معلمية الانحدار الذاتي من الدرجة الأولىء 6 معلمية 
المتوسط المتحرك من الدرجة الأولى» e,‏ تمثل أخطاء الضجة البيضاء white‏ 
noise‏ وهي غير مترابطة وعشوائية» arima‏ تناسب النماذج البسيطة مشل 
الحالة الخاصة في المعادلة ]1.12[ و[2.12] مع ثابت (Bo)‏ يقوم باس تيدال 
الصيغة الهيكلية XP‏ وبالتالي فإن نموذج ARMA(I,1)‏ البسيط يصبح: 

J - 0 + بلا‎ 

= By = Pha +O En +€, ]3.12[ 

بعض المصادر تعرض أشكالاً بديلةء ففي ls‏ (۸۸۷۸)1,1 فإنها تعرض بر 
كدالة لقيمة y‏ السابقة m)‏ وتعرض (e)‏ وأخطاء تباطؤية (ر,ع): 

J = بم‎ + PY, +O رك‎ + >, [4.12] 

وبما أن النموذج الهيكلي المبسط يحتوي ب + cy, = Bo‏ فإن المعادلة ]3.12[ 
(المستخدمة من قبل برنامج ستاتا) تعادل المعادلة [4.12] كجزء من إعادة 
قياس الثابت ,#(م- 1( -». 
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وباستخدام الأمر c] carima‏ نموذج ARMA(LI)‏ يمكن تبسيطه بإحدى 
الطريقتين التاليتين: 
earima y, ar(1) ma(1)‏ 
X‏ 
.arima y, arima(1,0,1)‏ 
الحرف 1 في الأمر arima‏ هو اختصار لكلمة 'متكامل" "integrated"‏ 
والتي تشير إلى النماذج التي تتضمن اختلافات» ولصياغة Tisi‏ 
ARIMA(2,1,1)‏ نقوم باستخدام: 
.arima y, arima(2,1,1)‏ 
وهذا يكافئ: 
.arima D.y, ar(1/2) ma(1)‏ 
لاحظ بأن الخيار arima(‏ هو الرقم المُعطى لصيغة الانحدار AM‏ أو 
المتوسط المتحرك الذي يحدد كل فترات التباطؤء والتي تتضمن ذلك الرقم» 
إذن فإن الرقم "2" يعني فترتي تباطؤ 1 و2. وعند استخدام الخيارات maQ‏ 
أو ar)‏ فإن العدد المستخدم يقوم بتحديد فترة تباطؤ معينة فقط. إذن فإن الرقم 
"2" يعني فترة تباطو تساوي 2 فقط. الأمران أعلاه يحددان نموذجا به 
الاختلافات الأولى للمتغير التابع ya)‏ بن هو دالة للاختلافات الأولى مع 
فترة تباطؤ واحدة وفترتي تباطؤ سابقة ya - yr)‏ و ya‏ = يبن وكذلك 
للأخطاء الحالية والسابقة ) € وريع). 


ام 


لتقدير نموذج هيكلي والذي به بر تعتمد على متغيرين تنبؤيين × (قيم 
حالية وتباطؤية ,د (x15‏ و« (القيم الحالية فقط (w,‏ مع أخطاء ARIMA(1,0,3)‏ 
Lal,‏ الأخطاء ARIMA(L0,I)‏ الموسمية المضاعفة والتي تعود إلى 12 فترة 
زمنية (حيث إنها تكون مناسبة للبيانات الشهرية خلال عدد من السنوات) 
والأمر المناسب للقيام بذلك قد يأخذ الصيغة التالية: 
.arima y x L.x w, arima(1,0,3) sarima(1,0,1,12)‏ 

وفي سياق الاقتصاد القياسيء فإن هذا يتوافق مع نموذج 
ARIMA(1,0,3)x(1,0,1));‏ 

السلسلة الزمنية ر تعتبر مستقرة إذا كان متوسطها وتباينها لم يتغيرا مع 
الوقت» وإذا كان التغاير المصاحب بين بر وبر يعتمد فقط على فترة تباطؤ مم 
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وليس على قيم معينة ل d‏ صياغة نماذج ARIMA‏ تفترض أن السلسلة 
Aia jl‏ مسلازة Jf‏ يمكن جلها d jaa‏ من خلال طرق عتاسية التدريق J‏ 
الفروقات. يمكننا فحص هذه الفرضية بواسطة فحص الشكل البياني لاتجاه 
الزمن من خلال مستوى التباين. رأينا سابقاً أن درجات الحرارة العالمية مثلاً 
شهدت اتجاهاً معيناً يوضح بأنها غير مستقرة. 

الاختبارات الإحصائية الرسمية ل 'جذور الوحدة' غير مستقرة في طريقة 
ARC)‏ والتي تكون فيها 1 = ,م (والتي تعرف أيضاً بأنها المسار العشوائي) تعتبر 
نظرية المتممة و فحص غير رسميء برنامج ستاتا يوفر ثلاثة اختبارات rE‏ 
jl‏ $25 هي: pperron‏ (فيليبس- برون dfuller «(Phillips-Perron‏ (ديكي jJ-‏ 
المتمم dfgls «(augmented Dickey-Fuller‏ (ديكي - فولر المتمم باستخدام (GLS‏ 
ويُعتبر اختبار 98615 أقوى الاختبارات وأكثر معلومات. 

الجدول أدناه Gib}‏ الأمر 416 على بيانات المركز الوطني للمناخ 
(NCDC)‏ وهي درجات الحرارة العالمية الشاذة. 

.dfgls ncdctemp, notrend 


DF-GLS for ncdctemp Number of obs - 355 
Maxlag = 16 chosen by Schwert criterion 


DF-GLS mu 1$ Critical 5$ Critical 10$ Critical 
[1ags] Test Statistic Value Value Value 
16 -1.162 -2.580 -1.952 -1.637 
15 -1.191 -2.580 -1.955 -1.640 
14 31.179 -2.580 -1.958 -1.643 
13 -1.170 -2.580 -1.962 -1.646 
12 -1.194 -2.580 -1.965 -i.649 
11 -1.264 -2.580 -1.968 -1.652 
10 -1.190 -2.580 -1.971 -1.655 
9 -1.204 -2.580 -1.974 =1.658 
8 -1.525 -2.580 224977 -1.660 
F -1.462 -2.580 -1.980 -1.663 
6 -1.639 -2.580 -1.982 -1.665 
5 -1.844 -2.580 -1.985 -1.668 
4 -1.968 -2.580 -1.988 -1.670 
3 -2.058 -2.580 721.990 -1.672 
2 -2.342 -2.580 1:993 -1:675 
1 -2.731 -2.580 -1.995 -1.677 
Opt Lag (Ng-Perron seq t) = 9 with RMSE .0915337 
Min SC = -4.687887 at lag 1 with RMSE .0943745 


Min MAIC = -4.721196 at lag 9 with RMSE .0915337 
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مخرجات الأمر del dfgls.‏ توضح Gb‏ اختبارات عدم استقرارية فرضية 
العدم التي تقول ob‏ سلسلة درجات الحرارة تمثل مسارًا عشوائيا أو لها جذر 
san,‏ لفترات تباطو من 1 إلى 16 شهراء وفي أسفل جدول المخرجات هناك 
ثلاث طرق مختلفة لاختيار العدد المناسب من فترات التباطؤ: “Ng‏ بيرون 
التتابعي «/Ng-Perron sequential‏ معيار المعلومات شوارتز Schwarz‏ الأقل» 
-Ng‏ بيرون لمعيار معلومات أكيكا Akaike‏ المعدلة MAIC (MAIC)‏ والذي تم 
تطويره A ida‏ وتجربة مونت كارلو Monte Carlo‏ كلاهما يدعم مميزات 
طريقة شوارتز. إن انتظام ¢ و7410 توصي باستخدام 9 فترات تباطؤ. كما أن 
النتائج توضح ob‏ إحصائية DE-GLS‏ ل 9 فترات تباطؤ هي 1.204- وهي 
أكبر من 9610 من القيمة الحرجة وهي 1.658- ولذلك يجب علينا رفض 
فرضية العدم. هذه النتائج ass‏ الانطباعات السابقة» والتي تقول بأن السلسلة 
الزمنية ncdctemp‏ ليست مستقرة. 

ومن ناحية أخرىء فإن هناك اختباراً مشابهاً لمؤشر ENSO‏ المتعدد 
يرفض فرضية عدم الاستقرار عند كل فترات التباطؤ حتى مستوى Hl‏ 


-dfgls mei, notrend 


DF-GLS for mei Number of obs - 355 
Maxlag - 16 chosen by Schwert criterion 





DF-GLS mu 1% Critical 5$ Critical 10$ Critical 

[lags] Test Statistic Value Value Value 

16 -3.686 -2.580 71:952 -1.637 

15 -3.742 -2.580 21:955 -1.640 

14 -3.681 -2.580 -1.958 -1.643 

13 -4.062 -2.580 -1.962 -1.646 

12 -4.381 -2.580 -1.965 -1.649 

1i -4.352 -2.580 -1.968 -1.652 

10 -4.420 -2.580 24.99: -1.655 

9 -4.451 -2.580 -1.974 -1.658 

8 -4.589 -2.580 -1.977 -1.660 

7 -4.604 -2.580 -1.980 -1.663 

6 -4.655 -2.580 -1.982 -1.665 

5 -4.699 -2.580 -1.985 -1.668 

4 -4.591 -2.580 -1.988 -1.670 

3 -4.909 -2.580 -1.990 -1.672 

2 -4.293 -2.580 -1.993 -1.675 

1 -4.049 -2.580 -1.995 21.6717 
Opt Lag (Ng-Perron seq t) = 3 with RMSE .2688427 
Min sc = -2.565539 at lag 1 with RMSE .2727197 
Min MAIC = -2.497381 at lag 1 with RMSE  .2727197 


بالنسبة للسلاسل المستقرة مثل emei‏ فإن التمثيل البياني BLE DU‏ يعتبر 
دليلا حول اختيار نموذج ARIMA‏ المبدئي: 
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ARE)‏ الانحدار الذاتي من الدرجة ep‏ وله ارتباطات ذاتية تنخفض بشكل 


MA(4) 


ARMA(p,q) 


تدريجي مع كل زيادة في فترات «Saul‏ الإرتباطات الذاتيية 
الجزئية تتوقف بعد فثرة تباطؤ م. 

المتوسط المتحرك من الدرجة eg‏ وله ارتباطات ذاتية تتوقف بعد 
فترة تباطو ag‏ الارتباطات الذاتية الجزئية تنخفض تدريجياً مع 
كل زيادة في فترات التباطؤ. 

المتوسط المتحرك - الانحدار الذاتي المختلط والذي له ارتباطات 
ذاتية» وارتباطات ذاتية جزئية تنخفض تدريجيا مع كل زيادة في 
فترات التباطؤ. 


٠‏ المنحنى a d T‏ باجم يوس بدي 
isl “CALLE NI Agal‏ الجزئية عند em d ns‏ موسمية. 

رأينا سابقاً أن الارتباطات الذاتية للمتغير mei‏ تنخفض تدريجياً مع زيادة 
فترات kill‏ (الشكل 12 .14( بينما الارتباطات الذاتية الجزئية تتوقف يعد 
فترة تباطو تساوي 2. هذا النمط في التمثيل البياني للارتباط مع نتائج اختبار 
اة call aedi‏ وتش إلى أنه ISA‏ صواقة ترتع mei. id‏ 
وذلك بعملية -ARIMA(2,0,0)‏ 


.arima mei, arima(2,0,0) nolog 


ARIMA regression 


Sample: 321980 - Dec2010 Number of obs = 372 
Wald chi2(2) = 4385.66 
Log likelihood = -43.61494 Prob > chi2 = 0.0000 
1 OPG 
mei coef. Std. Err. 2 P>|z| [95$ Conf. Interval] 
mei 
cons .2814275 .2132974 1.32 0.187 -. 8 .6994828 
ARMA 
ar 
Li. 1.349918 .0424774 31.78 0.000 1.266664 1.433173 
L2. -7.4163392 .0415425 -10.02 0.000 7.497761 -.3349174 
/sigma .2710638 .0091183 29.73 0.000 .2531922 .2889354 








Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 


truncated at zero. 
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نموذج ARIMA(2,0,0)‏ يمثل المتغير mei‏ كدالة للأخطاء (p)‏ من شهر 
ماضي وشهرين ماضيين» بالإضافة إلى أخطاء الضجة البيضاء العشوائية 
(e)‏ 

Y, = Bo + Bia + Putat €, [5.12] 

حيث إن: y,‏ قيمة المتغير mei‏ عند الزمن :» مخرجات الجدول توضح 
معلمية لتقدير 0.28 7 fo‏ €« 1.35 = رم» 417042 

بعد صياغة نموذج arima‏ هذه Jail)‏ ات والنتائج الأخرى يتم حفظها 
بشكل مؤقت بطريقة ستاتا المعتادة» فمثلا لمشاهدة معامل النموذج AR(1)‏ 
والخطأ المعياري نقوم بطباعة الأمر: 

. 0155133: [ARMA] b[L1.ar] 
1.3499184 


.display [ARMA] se[Li1i.ar] 
.04247738 


معاملات الانحدار الذاتي من الدرجة الأولى والدرجة الثائية في هذا 

المثالء كلها ذات معنوية إحصائية وبعيدة جداً عن الصفرء )1-31.78 و10.02- 

EIERNE E ر لتوو‎ odi إلى‎ ty وھا‎ (Tal على‎ 

الحصول على القيم المتوقعة والبواقي والإحصائيات الأخرى بعد الأمر 
arima‏ من خلال :predict on‏ 

predict meihat 

.label variable meihat "predicted MEI' 


.predict meires, resid 
.label variable meires "residual MszI' 


بيانياًء فإن القيم المتوقعة من هذا النموذج تظهرغير واضحة من درجات 
الحرارة المشاهدة (الشكل 16.12). هذه الصورة توضح مدى تقارب نماذج 
4 والتي يمكنها أن تتناسب بدرجة كبيرة مع السلاسل المرتبطة ذاتيا 
من خلال التنبؤ بمتغير من خلال قيمه السابقةء بالإضافة إلى قيم الأخطاء 
السابقة» نموذج jai ARIMA(2,0,0)‏ حوالي %90 من تباين المتغير mei‏ 


.tsline meimeihat, lcolor(blue red) 
lwidth(medium medthick) 

xtitle("") xlabel(, grid gmax gmin) 
ytitle("MEI') 
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ylabel(-2(1)3, grid gmin gmax) yline(0, 
lcolor(gs12)) 


N 


-| 


MEI 








T —€M——Á— 
Jan1980 Jan1990 Jan2000 Jan2010 
predicted MEI 








Multivariate ENSO Index 
(16.12) الشكل‎ 


اختبار مهم لكفاءة نموذج ARIMA‏ يتم من خلال ما إذا كانت البواقي 
تظهر غير مترابطة مع التشويش. الأمر corrgram‏ يختبر فرضية العدم 
للضجة البيضاء من خلال فترات shla‏ مختلفة. 


.corrgram meires, lags(13) 





-1 0 1 -1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
$ -0.0241 -0.0241 .2176 0.6409 
2 -0.0099 -0.0105 .25451 0.8805 
3 0.1430 0.1430 7.9641 0.0468 
4 -0.0015 0.0049 7.965 0.0929 
5 0.0256 0.0292 8.2135 0.1449 
6 0.0200 0.0010 8.3656 0.2125 
7 -0.0305 -0.0315 8.7197 0.2734 
8 -0.0001 -0.0109 8.7197 0.3665 
9 -0.0306 -0.0367 9.0787 0.4300 
10 -0.0274 -0.0256 9.3682 0.4976 
11 -0.0292 -0.0331 9.6962 0.5579 
12 -0.0009 0.0079 9.6966 0.6426 
13 -0.0449 -0.0404 10.477 0.6545 


اختبارات portmanteau Qcorrgram‏ لم تجد أي ارتباط ذاتي ذي .معنوية 
إحصائية بين البواقي حتى فترة تباطؤ تساوي 13( باستثناء علاقة واحدة فقط 
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بمستوى أقل من 0.05 عند فترة التباطؤ 3» يمكننا القيام بنفس الاختبار لأي 
فترة تباطؤ معنية باستخدام الأمر wntestq‏ مثل: 
.wntestq meires, lags(13)‏ 
Portmanteau test for white noise‏ 


Portmanteau (Q) statistic = 10.4772 
Prob » chi2(13) - 0.6545 


ولذاء فإن نموذج ARIMA(2,0,0)‏ تم اقتراحه بعد النظر إلى الأنماط 
الموجودة ببيانات الارتباط الذاتي؛ والتي توضح Gb‏ النموذج يتناسب بدرجة 
كبيرة» حيث إن كل صيغ الخطأ AR‏ ذات معنوية إحصائية» وهذا يترك 
البواقي التي اجتازت اختبار الضجة البيضاء: 
اختباراتنا السابقة notrend «dfgls‏ لدرجات الحرارة العالمية الشاذة 
—(ncdctemp)‏ تختلف عن اختبار مؤشر ENSO‏ التراكمي “inet‏ حيث إنها 
توضح بأن درجات الحرارة تظهر غير مستقرة بسبب أنها تتضمن اتجاهاً 
oc‏ راء اختبار dfgls‏ الافتراضي يتضمن اتجاهاً خطياً يرفض فرضية 
العدم التي تفترض عدم الاستقرار عند كل فترات التباطؤ. 
ncdctemp‏ 059015 . 


DF-GLS for ncdctemp Number of obs - 355 
Maxlag - 16 chosen by Schwert criterion 


DF-GLS tau 1$ Critical 5$ Critical 10% Critical 
[1ags] Test Statistic Value Value Value 
16 -3.624 -3.480 -2.818 -2.536 
15 -3.625 -3.480 -2.824 -2.542 
14 -3.552 -3.480 -2.829 -2.547 
13 -3.489 -3.480 -2.835 -2.552 
12 -3.486 -3.480 -2.840 -2.557 
11 -3.566 -3.480 -2.846 -2.562 
10 -3:395 -3.480 -2.851 -2.566 
9 93.371 -3.480 -2.856 22.971 
8 -3.861 -3.480 -2.861 -2.575 
7 -3.697 -3.480 -2.865 -2.580 
6 -3.950 -3.480 -2.870 -2.584 
5 -4.251 -3.480 -2.874 -2.588 
4 -4.399 -3.480 -2.879 -2.592 
3 -4.479 -3.480 -2.883 -2:595 
2 -4.920 -3.480 -2.887 -2.599 
1 -5.505 -3.480 -2.891 -2.602 
Opt Lag (Ng-Perron seq t) = 9 with RMSE .0902188 
Min SC = -4.749446 at lag 1 with RMSE .0915139 


Min MAIC = -4.639686 at lag 9 with RMSE .0902188 
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الاختلافات الأولية لدرجات الحرارة اوكا ن a‏ الذاتية التي 
تتوقف بعد فترة تباطو تساوي 1» والارتباطات الذاتية الجزئية تنخفض بعد 
فتراة تباطؤ تساوي 1. 


.Corrgram D.ncdctemp, lag(13) 


st 0 t =I 0 1 

LAG AC PAC Q Prob»Q  [Autocorrelation] [Partial Autocor 
1 -0.3941 -0.4031 58.094 0.0000 
2 0.0425 -0.1355 58.773 0.0000 
d -0.0639 -0.1174 60.307 0.0000 
4 0.0305 -0.0479 60.656 0.0000 
5 -0.0359 -0.0614 61.145 0.0000 
6 -0.0385 -0.1032 61.706 0.0000 
39 -0.0035 -0.0872 61.711 0.0000 
8 0.0633 0.0164 63.239 0.0000 
9 -0.1316 -0.1432 69.861 0.0000 
10 0.1031 -0.0149 73.938 0.0000 
11 0.0030 0.0359 73.942 0.0000 
12 -0.0353 -0.0393 74.421 0.0000 
13 0.0099 -0.0175 74.459 0.0000 


هذه المشاهدات تشير إلى أن نموذج ARIMA(0,1,1)‏ قد يكون مناسباً 
لدرجات الحرارة. 


.arima ncdctemp, arima(0,1,1) nolog 


ARIMA regression 


Sample:  Feb1980 - Dec2010 Number of obs = 371 
Wald chi2(1) = 152.87 
Log likelihood = 355.3385 Prob > chi2 = 0.0000 


OPG 
D.ncdctemp Coef. Std. Err. z P>|z| [95$ Conf. Interval 
ncdctemp 
-cons .0007623 .0025694 0.30 0.767 -.0042737 .0057982 
ARMA 
ma 
L1. -.4994929 .040399 -12.36 0.000 -.5786735 -.4203124 
/sigma .0928235 .0029514 31.45 0.000 .0870388 .0986081 





Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 
truncated at zero. 
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نموذج ARIMA(0,1,1)‏ يشرح الاختلاف الأول أو التغير من شهر إلى 
شهر في درجة الحرارة كدالة للخطأ العشوائي مع فترة تباطؤ تساوي شهرا 
واحداً أو كدالة للخطأ العشوائي للشهر الحالي: 

Yı- Ya = By +8 بع + ريع‎ ]6.12[ 

حيث إن: y,‏ تمثل المتغير nedotemp‏ عند الزمن t‏ ومُقدّرات المعلميات 

هي 0.00076 Bo‏ و 0.499- = 0ء حد MA‏ من الدرجة الأولى 0 ذو معنوية 

إحصائية (0.000: (p‏ وبواقي النموذج لا يمكن تمييزها عن الضجة البيضاء. 

.predict Dncdchat 

-label variable Dncdchat "predicted ist diff 

temp 


.predict Dncdcres, resid 
.label variable Dncdcres "residual 1st diff 


temp" 
.corrgram Dncdcres, lag(13) 
-1 0 1-1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
و سے‎ 
1 0.0133 0.0135 .06574 0.7976 
2 0.0262 0.0265 .32335 0.8507 
3 -0.0631 -0.0657 1.8204 0.6105 
4 -0.0313 -0.0306 2.1907 0.7007 
5 -0.0848 -0.0827 4.912 0.4267 
6 -0.0867 -0.0910 7.7626 0.2560 
E -0.0357 -0.0362 8.2477 0.3113 
8 0.0079 -0.0002 8.2716 0.4074 
9 -0.0970 -0.1201 11.866 0.2210 
10 0.0759 0.0635 14.074 0.1696 
iL 0.0255 0.0143 14.324 0.2156 
12 -0.0225 -0.0568 14.519 0.2688 
13 0.0008 -0.0004 14.519 0.3383 


بالرغم من أن هذه الاختبارات لا تعطي سبباً واضحاً لاستبعاد 
CARIMA(O,1,1)‏ إلا أنه من الصعب تنبؤ التغيرات الشهرية في درجات 
الحرارة العالمية الشاذةء الشكل )17.12( يستخدم مُعامل الاختلاف D.‏ في 
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الأمر graph‏ لعرض cual‏ بسيط بين القيم المتوقعة والقيم المشاهدة هذا 
النموذج يشرح حوالي 2020 من التباين في الاختلافات الشهرية. 
.tsline D.ncdctempDncdchat, lcolor(blue red)‏ 
xtitle("") xlabel(, grid gmax gmin)‏ 
lw(medtbick medium)‏ 
ytitle("Monthly change in temperature,‏ 
`=char (176) 'C")‏ 
ylabel(, grid gmin gmax) yline(0)‏ 
legend(ring(0) position(7)‏ 
row(2) label(1 "change in temp") label(2‏ 
"predicted change"))‏ 
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الرسم البياني للتغيرات أو الاختلافات d‏ في الشكل )17.12( 
يعطي تشابهاً بسيطاً مع درجات الحرارة الشاذة نا نفسها التي سبق مشاهدتها في 
الشكل )9.12( العكس يؤكد Gh‏ صياغة نماذج للاختلافات الأولى يعطي 
الإجابة عن سؤال بحث مختلف. 

في هذا المثال الميزة الرئيسة لدرجات الحرارة المسجلة - الاتجاه نحو 
الارتفاع - تم استبعاده؛ الجزء a‏ يعود إلى درجات الحرارة الشاذة غير 
المختلفة ويأخذ في الاعتبار كيفية إمكانية شرح هذا الاتجاه نفسه. 
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pe‏ الثاني on]‏ حي 0 0 ea‏ 
اذخ ARMAX Models : (ARMAX)‏ 


i xj مع‎ nedetemp للمتغير‎ OLS jasil في هذا الفصل» رأينا أن‎ RA 
متغيرات تنبؤية بأربع فترات تباطؤ يعطي تناسباً جيدًا مع قيم درجات الحرارة‎ 
المشاهدة (الشكل 2.12)؛ بالإضافة إلى تقديرات معلمية معقولة» اختبار دربن‎ 
معنوية بين البواقي‎ ONS أظهر بأن هناك ارتباطات ذاتية‎ Durbin-Watson واتسون‎ 
ولحل هذه المشكلة تقوم باستخدام نماذج‎ OLS F وهذا يقوّض اختبارات‎ 
(المتوسط المتحرك للانحدار الذاتي مع متغيرات خارجية).‎ ARMAX 

نموذج ARMAX‏ مع متغيرات تنبؤية بفقترات تباطو لشهر واحد 
واضطراب ARIMA(L0,1)‏ اتضح caulis asl‏ بشكل جيد. 


.arima ncdctemp Li.aod L1.tsil L1.mei 
Li.co2Zanom, arima(1,0,1) nolog 


ARIMA regression 


Sample:  Febi980 - Dec2010 Number of obs - 371 
Wald chi2(6) = 555.93 
Log likelihood = 378.3487 Prob > chi2 = 0.0000 



















ncdctemp Coef. Std. Err. 2 P-lz| [95% Conf. Interval] 


een 


ncdctemp 
aod 
nl. -1.228967 . 3855346 -3.19 0.001 -1.984601 -.4733331 
tsil 
Li. -0609574 .0173356 3.52 0.000 .0269803 -0949345 
mei , 
L1. - 0533736 0099622 5.36 0.000 . 033848 .0728992 
co2anom 
Ll. .0104806 .0008328 12.58 0.000 . 0088483 .0121126 
-82.84697 23.68097 -3.50 0.000 -129.2608 -36.43313 












7119696 .0703746 10.12 0.000 5740378 .8499013 


ma 
-.3229314 .0944706 -3.42 0.001 -.5080903 -7.1377725 









/sigma .0872355 .0028313 30.81 0.000 .0816863 -0927847 


Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 
truncated at zero. 
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في هذا النموذج بر أو المتغير nedetemp‏ عند الزمن + هو دالة لقيم 
المتغيرات التنبؤية من ar‏ وحتى ,د مع فترة تباطؤ تساوي 1 (هذه المتغيرات 
من aod‏ وحتی (co2anom‏ واضطراب iu).‏ 

yı = Bot Bia + Xati + Boa + Baran tHe [7.12] 

الاضطراب عند الزمن (u)‏ يتعلق باضطراب مع فترة تباطؤ تساوي 1 
(.)» ومتعلق كذلك بأخطاء عشوائية لها فترة تباطؤ تساوي 1 عند الزمن t‏ 
)1&4 ,€( 

U, — Pha =0 ريك‎ + €, [8.12] 

مُعاملات كل المتغيرات التنبؤية cA ag I]‏ وكذلك حدود MA 5 AR‏ 
جميعها ذات معنوبة إحصائية عند 0.01 > م أو أفضل من ذلكء المتغير 
Audi ncdctemp‏ غير مستقر» وليست هناك ala‏ ليكون كذلك في هذا 
التحليل» وعدم استقراره هو نقطة التركيز في البحث. البواقي من أي نموذج 
ناجح يُفترض أن تتشابه مع قيمة الضجة البيضاءء وقيمة استقرار التغاير» 
وهذا هو الوضع هنا. حيث إن: اختبار © يعطي 0.60 = p‏ للبواقي التي 
لها فترات تباطؤ تصل حتى 25. 


.predict ncdchat2 

.label variable ncdchat2 "Predicted from 
volcanoes, solar, ENSO & CO2' 

.predict ncdcres2, resid 

.label variable ncdcres2 "NCDC residuals from 
ARMAX model 

.Corrgram ncdcres2, lags(25) 
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E 0 1-1 0 1 


Prob>Q [Autocorrelation] [Partial Autocor] 


Q 


PAC 


AC 


593 


LAG 


0.7963 
0.6521 
0.8291 
0.8916 
0.9007 
0.7775 
0.8601 
0.9134 
0.6626 
0.4937 
0.5432 
0.6275 
0. 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 


6568 


+6960 
+7583 
-7786 
+6351 
. 6601 
.7127 
-7058 
-6686 
-6975 
-6790 
.5911 
+5987 


. 06661 
+ 85498 
.88473 
1.1169 
1.6043 


+245 


3 


3.2588 
3.3097 
6.7554 
9.4103 
9.8585 


.869 


9 


10.45 


.873 


10 


10.92 


.485 
.449 
.028 
+155: 
.174 
.688 
.143 
.379 
.802 
.638 


11 
14 
15 
15 
16 
17 
18 
19 
21 
22 


.0136 
.0471 
.0084 
.0229 
.0356 
.0710 
.0035 
.0177 
.0979 
.0868 


-0 


-0 


-0 


-0 
-0 


0.0433 


.0105 
.0457 
.0288 
.0273 
.0288 
.0861 
.0537 
.0130 
.0484 
.0764 
.0422 
.0551 
.0652 
.0457 


الشكل (18.12) يعرض التناسب الكبير بين البيانات 
النموذج يفسّر حوالي 7 من التباين في درجات الحرارة الشاذة. نتائج 
ARMAX‏ تدعم نتيجة عامة من نتائج 5 السابقة» حيث إن الاتجاه 


.0133 
.0458 
.0089 
.0248 
.0359 
-0658 
-0060 
-0116 
.0949 
.0832 
.0341 
.0052 
.0388 
.0330 
.0110 
.0381 
.0871 
.0384 
.0180 
.0508 
.0619 
.0339 
.0557 
-0779 
-0457 
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-ARMAX ونموذج‎ 


المتصاعد خلال عقود متعددة في درجات الحرارة لا يمكن تفسيره بدون 
الأخذ في الاعتبار العوامل البشرية. ومن ناحية sl‏ فإن الانخفاض 
الواضح في الاحتباس الحراري خلال العقد الأخير يمكن تفسيره في ظل 
ظاهرة طبيعية إلينوي» وظاهرة انخفاض أشعة الشمس. 
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حتى هذه النقطةء لدينا تفاصيل عن مؤشر واحد لدرجة الحرارة من 
ثلاثة مؤشرات بملف البيانات .Climate.dta‏ هذا المؤشر تم استخراجه من 
بيانات المركز الوطني للمناخ NCDO)‏ التابع للإدارة الوطنية للغلاف الجوي 
والمحيط بالولايات المتحدة NCDC (NOAA)‏ حيث قام بحساب مؤشره 
الخاص به Sly‏ على قياسات درجة حرارة السطح» والتي تم أخذها من آلاف 
المحطات حول العالم. مركز ناسا لدراسات الفضاء قام بحساب مؤشره 
الخاص بدرجة الحرارة (يُطلق عليه (GISTEMP‏ والذي يعتمد على قياسات 
المحطات لدرجة حرارة السطح» ولكن مع تغطية جيدة للمناطق التي تقع في 
أقصى الشمال. 

مؤشر درجة الحرارة الثالث في الملف Climate.dta‏ له قاعدة KA ahaa‏ 
فالباحثون بجامعة الباما هندسفيل (UAH)‏ قاموا بحساب مؤشرهم العالمي من 
مقاييس غير مباشرة من الأقمار الصناعة التي قامت بتصوير طبقات الجو 
العليا وأجواء الأرض عند ارتفاع حوالي 4 كيلومترات» التقديرات التي تعتمد 
على الأقمار الصناعية توضح تغيرًا كبيرًا من شهر إلى شهر وهي تغيرات 
حساسة لظهور إلنينو ولانينا. هذه التقديرات تعتبر نظرة بديلة عن اتجاهات 
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الفصل الثاني عقيس : مكيل الا ا سسسب 
درجات الحرارة العالميةء وهي تتشابه مع سجلات السطح» ولكنها تختلدف 
قليلاً في التفاصيل. السؤال هنا: كيف يتم عرض هذه الاختلافات Laie‏ نقوم 
بصياغة نموذج للمتغير uahtemp‏ بنفس طريقة ARMAX‏ التي تم اس تخدامها 
مع المتغير Sncdctemp‏ 


.arima uahtemp L1.aod L1.tsil L1.mei 
L1.co2anom,arima(1,0,1) nolog 


ARIMA regression 


Sample: Feb1980 - Dec2010 Number of obs = 371 
Wald chi2(6) = 601.88 
Log likelihood - 299.2819 Prob » chi2 - 0.0000 










uahtemp Coef. Std. Err. z P»|z| [95$ Conf. Interval 
















uahtemp 
aod 
L1. -2.38566 -9011263 -2.65 0.008 -4.151835 -.6194849 
tsil 
L1. .0336446 .0289365 1.16 0.245 -.0230698 -0903591 
mei 
L1. -0663992 -0154607 4.29 0.000 -0360967 -0967016 
co2anom 
L1. -0084778 .0016671 5.09 0.000 0052103 .0117453 
-45.92206 39.52334 E 0.245 -123.3864 31.54227 





ARMA 







L1. -8364133 -0421928 19.82 0.000 .7537169 -9191097 
ma 


Li. -.3170064 . 068849 -4.60 0.000 7.451948 -.1820648 









.1078988 . 0040726 26.49 0.000 - 0999167 .115881 


Note: The test of the variance against zero is one Sided, and the two-sided confidence interval is 
truncated at zero. 


معاملات نموذج NCDC‏ ونموذج —UAH‏ كما أن معاملات NASA‏ لم يتم 
عرضها هنا - كلها لها نفس الإشارة وتتشابه مع الفهم الطبيعي. كل النماذج 
الثلاثة تؤكد Ob‏ أقوى متغير تنبؤي Gla jal‏ الحرارة هو القيم الشاذة ل CO;‏ 
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وثاني أقوى متغير تنبؤي هو MEI‏ المتغير MEI‏ له تأثير أكبر نسبياً في 
UAH gisa‏ وهذا هو المتوقع من بيانات الأقمار الصناعيةء كما أن ثورات 
البراكين لها Lead‏ تأثيرات قوية على مؤشر UAH‏ بينما paca ied‏ 
لها تأثيرات أقل قوةء هذا يعكس التغير المرتفع في التقديرات التي تعتمد 

الأقمار الصناعة» كما أن النموذ ذج يشرح حوالي %70 من التباين $ ae‏ 
75 مقارنة مع %77 للمتغير cncdetemp‏ وعمو a‏ فإن البواقي اجتازت 
الاختبارات الخاصة بالضجة البيضاء (0.65 = «(p‏ والرسم البياني للقيم 
المتوقعة والمشاهدة يعرض تناسباً مرئياً جيدًا (الشكل 19.12). 


.predict 22 


.label variable uahhat2 "Predicted from 
volcanoes, 


solar, ENSO & CO2' 
.predict uahres2, resid 


.label variable uahres2 "UAH residuals from 
ARMAX model" 


.wntestq uahres2, lags (25) 


Portmanteau test for white noise 





21.7197 
0.6519 


Portmanteau (Q) statistic 
Prob » chi2(25) 
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درجات الحرار ة المسجلة بالأقمار الصناعية تمثل بيانات أكثر حداثة من 
سجلات محطات الإرصاد الجويةء ولذلك فإن درجات الحرارة الشاذة UAH‏ 
يمك حسابها للفترة من 2010-1981 كنقطة بداية بدلاً من 2000-1901. 
كما تم القيام به من قبل .NCDC‏ نقطة البداية تنتقل إلى نقطة الصفر لدرجات 
الحرارة الشاذة الأعلى» والذي يمكن رؤيته عند مقارنة الشكل (19.12) مع 
الشكل )18.12( G‏ السلسلتين تعطيان نفس الاتجاهات وهي حوالي 0.16 
درجة مئوية/عقد لدرجات حرارة (NASA. f) NCDC‏ خلال هذه الفقترة أو 
5 درجة مئوية/عقد لدرجات حرارة UAH‏ 
الاستنتاجات من نماذج ARMAX‏ البسيطة تتفق بشكل عام مع تلك التي 
تم الحصول عليها من تحليلات أكثر ladies‏ في دراسة Foster and Rahmstorf‏ 
)2011(« حيث إن طريقتهما تتضمن البحث عن مواصفات فترة التاطؤ 
cual‏ وهذا على عكس ما قمنا به هنا باختيار عشوائي لفترة تباطؤ شهر 
واحد لكل المتغيرات التنبؤي ih‏ كما أن دراسة Foster and Rahmstorf‏ تضمنت 
دوال مثلثية (سلاسل فوريير من الدرجة الثانية) لصياغة gila‏ الدورات 
Sid‏ للبواقي في البيانات. كما تم تضمين الزمن بدلاً من تركيز CO;‏ 
ضمن المتغيرات التنبؤيةء وذلك لتوضيح الاتجاهات ols gy Shy Agia‏ 
الاتجاهات تم تفسيرها بأنها أسباب بشرية. ومبدئياً فإن هذه الأسباب البشرية 
يمكن أن تتضمن الغازات المسببة للاحتباس الحراري إلى جانب «CO;‏ 
والأنشطة الأخرى مثل إزالة الغابات» وتغير الغطاء النباتي» أو استنزاف 
طبقة الأوز ون التي يمكن قياسها بو اسطة متغير .co2anom‏ ولذا فإن التفسير 
السببي CO‏ قد يكون ERT Jas Usny‏ فإن CO,‏ ازداد بشكل مباشر مع 
yl‏ 3< (الشكل 12 .10( Lassus‏ الوقت قت أو CO,‏ كمتغير تنبؤي سوف يعطي 
نتائج متشابهة. 


Ao) ge) 
صياغة نماذج التأثيرات المختلطة‎ 
والمستويات المتعددة‎ 
Multilevel and Mixed-Effects Modeling 





صياغة نماذج التأثيرات المختلطة هي عبارة عن تحليل انحدار يسمح 
بنوعين من التأثيرات» التأثيرات الثابتة: وهذا يعني أنها قيم التقاطع والميل» 
وهي تقوم بتفسير المجتمع ككل كما هو الوضع في الانحدار العادي. وأيضاً 
التأثيرات العشوائية: وتعني أن قيم التقاطع والميل يمكنها أن تكون متنوعة 
في المجموعات الفرعية للعينة. كل طرق الانحدار التي تم تناولها حتى الآن 
في م هذا الكتاب» تتضمن التأثيرات الثابتة فقط. صياغة نماذج للتأتيرات 
لمختلطة تفتح Yla‏ جديدا لاحتمالات نماذج المستويات المتعددة» وتحليل 

منحنى النموء والبيانات الطولية» والسلاسل الزمنية المقطعية. 
در Albright and Marinova Al‏ )2010( توضح مقارنة عملية بين طريقة 
صياغة النماذج المختلطة ببرنامج ستاتا 5 SPSS  SAS‏ و۸ مع برنامج 
صياغة نموذج خطي تر تيبي (HLM)the hierarchical linear modeling‏ تم 
تطويره بواسطة Raudenbush and Bryck and (2005) Raudenbush et‏ )2002( 
cal‏ ويمكن الاطلاع على شرح أكثر تفصيلاً للنماذج الثابتة وارتباطاتها مع 
HLM‏ في كتاب Rabe- Hesketh and Skrondal‏ )2012(« وباختصارء فإن طرق 
HLM‏ اسا النماذج ذات المستويات المتعددة تتم بعدة خطوات هي: تحديد 
معادلات منفصلة. فعلى سبيل المتال» لتأثيرات المستوى 1 والمستوى 2؛ 
وفي الواقع العملي هذه المعادلات لا يمكن تقديرها بطريقة منفصلةء ولذلك 
فإن البرنامج يقوم Ulla‏ بالاستعاضة عن ذلك مق خلان إنشاء معادلة 
مختصرة واحدة للتقدير. طريقة صياغة نماذج التأثيرات المختلطة تعمل 
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مباشرة مع المعادلة المختصرة Ghea‏ إياها مظهرًا ذا 'مستويات متعددة أقل" 
من طريقة HLM‏ حتى عندما تقوم الطريقتان بتفسير النماذج المتكاففة 
رياضيا. تأثيرات HLM‏ عند مستويات مختلفةء يمكنها أن تكون ممثلة بشكل 
متكافئ للتأثيرات العشوائية أو الثابتة» مع معادلة مختصرة واحدة؛ وقد لاحظ 
Rabe-Hesketh and Skrondal‏ (2012:171) بأن هناك بعض الاختلافات الثقافية 
بين HLM‏ وتطبيقات النماذج المختلفة: البحوث التي استخدمت [HLM]‏ تميل 
لتضمين تفاعلات أكثر عند مستويات مختلفة» ومعاملات عشوائية أكثر في 
النماذج (لأن نماذج المستوى 2 تظهر بشكل غريب بدون بواقي) من البحوث 
التي تستخدم ستاتا مثلا. 

هناك ثلاثة أوامر ستاتا تمثل الأداة الأكذر شيوعاً لصياغة نماذج 
التأثيرات المختلطة؛ وذات المستويات المتعددة. الأمر xtmixed‏ يُناسب 
النماذج الخطية مثل نظيره للتأثيرات المختلطة؛ وهو regress Yl‏ وبالمثل» 
فإن الأمر xtmelogit‏ يُناسب نماذج الانحدار اللوغاريتمية للتأثيرات المختلطة 
للمخرجات الثنائية» وكذلك فإن TC xtmepoisson 5 logistic 5 logit 4l A‏ 
نماذج بواسون للتأثيرات المختلطة للمخرجات المعدودة مثل تعميم الأمر 
.poisso‏ برنامج Giu‏ يوفر أيضا عددًا أكثر من طرق الحساب المتعلقة 
ببعض المهام المفاهيميةء الأمثلة تتضمن نماذج ذات حدين سالبة واحثماليةء 
ونماذج توبيت مع تقاطعات عشوائية. للحصول على قائمة كاملة مع روابط 
للتفاصيل عن كل أمرء قم بطباعة الأمر help xt‏ العديد من الأوامر تم 
تطويرها Y d‏ للاستخدام مع بيانات سلاسل زمنية مقطعية أو طولية» ول ذلك 
فإن أوامرها bla‏ ب xt‏ 

إجراءات Al‏ أمر xtmelogit g xtmixed‏ و xtmepoisson‏ يمكن تطبيقها من 
خلال طباعة الأوامرء أو من خلال القوائم: 

Statistics < Multilevel mixed-effects models 

قوائم الحسابات الأخرى ل xt‏ تم وضعها بشكل منفصل تحت القائمة 

التالية: 


Statistics < Longitudinal/panel data 
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يحتوي دليل المستخدم Longitudinal/Panel Data Reference Manual‏ على 
أمثلة» وتفاصيل نقنية» ومراجع للتأثيرات المختلطة» وطرق xt‏ الأخرى؛ 
كتاب Luke‏ )2004( يعرض مقدمة مختصر ة عن صياغة النماذج ذات 
المستويات المتعددة. كما أن هناك شرحاً Susa os‏ في كتاب )2007( 
Bickel‏ وكتاب McCulloch and Searle‏ )2001( وكتاب Raudenbush and‏ )2002( 
Bryk‏ وكذلك كتاب aa pall (2000) Verbeke and Molenberghs‏ الخاص e3ill‏ 
لمستخدمي برنامج ستاتاء هو "Multilevel and Longitudinal jl s~ias GUS‏ 
"Modeling Using Stata‏ للم لفين Rabe-Hesketh and Skrondal‏ )2012( يقوم 
بشرح الطرق الرسمية ل xt‏ ببرنامج ستاتا وكذلك البرامج غير الرسمية 
التي يُطلق عليها gllamm‏ التي تقوم بإضافة قدرات لصياغة نماذج خطية 
عاملة للتأثيرات Abba‏ لمزيد من المعلومات عن كيفية الحصول وتثبيت 
الملفات التنفيذية ado-files‏ لهذه البرامج قم بطباعة الأمر -finditgllamm‏ 


Example Commands : lotl أمثلة عن‎ 


-xtmixed crime year || city: year 

يقوم بحساب انحدار التأثيرات المختلطة لمتغير crime‏ (الجريمة) على 

متغير year‏ (السنة) مع تقاطع عشوائي» وميل لكل قيمة من قيم المتغير city‏ 

(المدينة)» ll,‏ سوف نحصل على معدلات الجريمة» والتي هي عبارة عن 

تركيبة من الاتجاه العام (التأثيرات الثابتة) مع تباينات على ذلك الاتجاه 
(التأثيرات العشواتية) لكل مدينة. 


-xtmixed SAT parentcoll prepcourse grades | | 
city:|| school: grades 


يقوم بصياغة نموذج التأثيرات المختلطة متعدد المستويات أو الهرمي 
متوقعاً نتائج SAT‏ للطلبة Aas‏ ل : (1) تأثيرات ثابتة أو تأثيرات العينة 
بالكامل لمعرفة ما إذا كان ally‏ أو والديّ الطلبة متخرّج من AUIS‏ وما إذا 
كان الطالب قد أخذ دورة إعداد ومعدل الطالب» )2( تقاطعات عشوائية تمثل 
تأثير المدينة التي بها المدرسةء )3( تقاطع عشوائي وميل لمُعامل معدل كل 
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طالب والذي قد يكون مختلفاً من مدرسة لأخرى؛ كل الطلبة (المشاهدات) لهم 
علاقة متشابكة بالمدارس» والأخيرة لها علاقة بالمدن التي تقع بها. لاحظ 
الترتيب لأجزاء التأثيرات المختلطة في الأمر. 


.xtmixed y x1 x2 x3 || state: x3 
-estimates store A 
.xtmixed y x1 x2 x3 || state: 


.estimates store B 

.lrtest A B 

يقوم بحساب معدل الاحتمال لاختبار م لفرضية العدم التي تفترض بعدم 

وجود اختلاف في التناسب بين النموذج الأكثر تعقيداً «d‏ والذي يتضمن ميلا 

على المتغير x3‏ والنموذج الأبسط B) B‏ موجود داخل (A‏ وهو لا يتتضمن 

ميلاً عشوائياً على المتغير ad‏ هذا يصل لاختبار ما إذا كان الميل العشوائي 

على 3× ذا معنوية إحصائية. الترتيب في النموذجين اللذين تم تحديدهما في 

الأمق 10686 لين مهماء إذا قمنا بطباعة Irtest B A‏ فإن برنامج ستاتا سوف 
يتعامل بشكل صحيح مع هذه العملية معتبراً أن B‏ متداخل في A‏ 


.xtmixed y xl x2 x3 || state: x2 x3, reml 
nocons cov(unstructured) 


يقوم بحساب انحدار التأثير ات المختلطة للمتغير ر على التأثيرات الثابتة 
للمتغيرات التنبؤية 1× x3, x2,‏ وأيضا على التأثيرات العشوائية للمتغيرات x2,‏ 
3 لكل قيمة من قيم المتغير Cus. «state‏ يتم الحصول على التقديرات 
بواسطة الحد الأقصى للاحتمال المحدود. النموذج يُفترض ألا يكون له تقاطع 
عشوائي» ولا مصفوفة تغاير غير منتظمةء والتي يكون بها تباينات التأثير 
العشوائي» وقيم التغاير كلها مقدّرة بوضوح. 
.estat recov‏ 
بعد الأمر xtmixed‏ يقوم الأمر أعلاه بعرض مصفوفة التغاير- التباين 
المقدّرة للتأثيرات العشوائية. 


.predict re*, reffects 
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بعد yd‏ التقدير xtmixed‏ يقوم هذا الأمر بحساب daf‏ تقديرات خطية 
غير المتحيزة (BLUPs)‏ لكل التأثيرات العشوائية في النموذج. التأثيرات 
العشوائية يتم حفظها كمتغيرات لها الأسماء التالية rel, re2‏ وهكذا. 
.predict yhat, fitted‏ 
بعد yd‏ التقدير xtmixed‏ يقوم الأمر أعلاه بحساب القيم المتوقعة للمتغير 
بره وللحصول على التوقعات من جزء التأثيرات المختلطة للنموذج فقط نقوم 
بطباعة predict yhat, xb‏ الخيارات الأخر ى predict‏ تقوم بإيجاد s La MI‏ 
المعيارية للجزء الثابت (stap)‏ أو البواقي المعيارية .(rstan)‏ وللحصول على 
قائمة ALS‏ من أوامر ما بعد التقدير مع روابطها وكيفية تركيبها وخياراتهاء 
قم بطباعة الأمر -help xtmixed postestimation‏ 
.xtmelogit y x1 x2 || state:‏ 
يقوم بحساب الانحدار اللوغاريتمي للتأثيرات الثابتة )0,1( للمتغير y‏ على 
المتغيرين X2, x1.‏ مع التقاطعات العشوائية لكل مستوى من المتغير state‏ 
.predict phat‏ 
بعد أمر التقدير xtmelogit‏ يقوم الأمر أعلاه بحساب الاحتمالات المتوقعة 
من نموذج كامل (ثابت زائد عشوائي)» لمعرفة أوامر ما بعد التقدير GAY‏ 
بالإضافة إلى قائمة كاملة بخيارات الأمر Les predict‏ فيها بواقي بواسون 
(pearson)‏ وبواقي الانحراف (deviance)‏ للحصول على تفاصيل أكثر عن 
أوامر ما بعد التقفدير وخياراتهاء قم بطباعة الأمر help xtmelogit‏ 
-postestimation‏ 


.xtmepoisson accidents x1 x2 X3, exposure 
(persondays)|| season:|| port: , irr 


يقوم بتقدير نموذج بواسون للتأثيرات المختلطة للمتغير accidents‏ الذي 
يحسب حوادث قوارب صيد الأسماك. المتغيرات التنبؤية للتأثير الثابت - 
وهي خصائص كل قارب ane‏ على حدة - هي 1× x2,‏ ,3×» ويتم قياس 
التعرئض بعدد شخص/ يوم في البحر لذلك القارب» نقوم بتضمين التقاطعات 
العشوائية لكل موسم j season‏ سنة» والمدينة التي بها الميناء port‏ التي 
تتداخل مع caul gall‏ النتائج توضح مُعاملات التأثير الثابت كنسب لمعدل 
الحوادث (irr)‏ 
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-gllamm warming sex educ,i(region) 
family(binomial) link(ologit)adapt 


يقوم بحساب النموذج الكامن الخطي المعياري والمختلط. وفي هذا 
المثال» يتم حساب الانحدار اللوغاريتمي المرتب للتأثيرات المختلطة للمتغير 
الترتيبي warming‏ على المتغيرات التنبؤية للتأثير الثابت للمتغيرين «sex, educ‏ 
ويتم إدراج التقاطعات العشوائية لكل قيمة من قيم المتغير region‏ والتي تم 
تقديرها من خلال التربيع التكييفي. الخياران link(s familyQ)‏ يمكنهما تحديد 
النماذج الأخرىء بما فيها اللوغاريتم متعدد الحدود والاحتمال واللوغاريتم 
التكميلي. الأمر gllamm.‏ ليس من الأوامر الرسمية ببرنامج ستاتاء ولكنه 
متوافر على شبكة الإنترنت KE‏ قم بطباعة الأمر findit gllamm‏ للحصول 
على معلومات عن كيفية تحميله وتثبيته والملفات الضرورية الخاصة به 
كتاب Rabe-Hesketh and Skrondal‏ )2012( يعطي تفاصيل أكثر» وأمثلة عن 
كيفية استخدام الأمر .gllamm‏ 


الاحدار Ew‏ التقاطعات العشوائية : 


Regression With Random Intercepts 





لشرح Ca gus xtmixed. yY!‏ نبدأ مع بيانات على مستوى الدولة» حيث 
إن البيانات تتعلق بالانتخابات الرئاسيّة بالولايات المتحدة لسنة 2004 (دراسة 
Robinson‏ 2005(. في هذه الانتخابات فاز جورج بوش daa)‏ على 9650.7 
من الأصوات) dya‏ هزم كلا من جون كيري )9648.3( ورالف نادر 
(0.4). السمة المثيرة في هذه الانتخابات كانت نمطها الجغرافي؛ حيث J‏ 
كيري بولايات في الساحل الغربي والشمال الشرقي وحول البحيرات 
العظمى» بينما بوش فاز في كل الولايات الأخرى. دعم بوش كان قوياً في 
المناطق الريفية؛ بينما الأصوات التي حصل عليها كيري تركزت في المدن» 
ملف البيانات election. 2004i‏ يحتوي .على نتائج الانتخابات والمتغيرات التي 
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تغطي مقاطعات الولايات aid‏ هناك متغير نوعي يحتوي على تقسيمات 
السكان (cendiv)‏ والذي GUY oll ed‏ المتحدة إلى 9 مناطق جغرافية. كما أن 
المتغيرات تتضمن العدد الكلي للأصوات (votes)‏ ونسبة أصوات بوش هي 
(bush)‏ بينما لوغاريتم الكثافة السكانية (logdens)‏ والذي يُعتبر كمؤشر على 
ريفية ibid‏ والمتغيرات الأخرى لنسبة سكان المقاطعة التي تنتمي إلى 
الأقليات العرقية (minority)‏ أو البالغين الحاصلين على درجة جامعية 


-(colled) 

.use C:\data\election_2004i.dta clear 
-describe 

Contains data from C:\data\election_2004i.dta 

obs: 3,054 US counties -- 2004 election (Robinson 2005) 

vars: 11 2 Jul 2012 06:11 

size: 219,888 
——————————————————————— 

storage display value 

variable name type format label variable label 
———————————————————ÀÁ——— 
fips long  $9.0g FIPS code 

state str20 95 State name 

State2 Str2  $9s State 2-letter abbreviation 

region byte — $9.0g region Region (4) 

cendiv byte %15.0g division Census division (9) 

county str24 $24s County name 

votes float %9.0g Total # of votes cast, 2004 

bush float %9.0g % votes for GW Bush, 2004 

logdens float %9.0g logl0(people per square mile) 

minority float %9.0g % population minority 

colled float %9.0g $ adults >25 w/4+ years college 





Sorted by: fips 


نسبة المقترعين لصالح بوش انخفضت كلما زادت كثافة السكان US‏ هو 
معروض في شكل الانتشار وخط الانحدار بالشكل )1.13( كل نقطة تمشل 
مقاطعة واحدة من 3,054 مقاطعة. 


graph twoway scatter bush logdens, msymbol (Oh) 
|| 1fit bush logdens, lwidth(medthick) 
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الشكل )1.13( 


النسخة المطوّرة لهذا الشكل البياني الذي يمثل الكثافة السكانية مع 
الانتخابات تظهر في الشكل (2.13). القيم اللوغاريتمية على المحور الأفقي 
تم توصيفها )1 تصبح "010 2 تصبح "100" وهكذا) وذلك dead‏ هذه القيم 
قابلة للقراءة بسهولة. وباستخدام votes‏ كأوزان تكرارية لشكل الانتشار مما 
جعل العلامات بمنطقة شكل الانتشار جزءًا فقط إلى العدد الكلي للأصوات 
الانتخابية؛ حيث هناك فرق واضح بين المقاطعات التي تكون بها ARES‏ سكان 
كبيرة أو صغيرة: وإذا لم يتم ذلك فإن التحليل في هذا الفصل لن يستخدم 
الأوزانء سوف نركز هنا على اتجاهات التصويت بدلا من الأفراد في هذه 
المقاطعات. 


.graph twoway scatter bushlogdens [fw=votes], 
msymbol (Oh) 
|| 1fit bush logdens, lwidth(medthick) 
|| , xlabel(-1 "0.1" O "1" 1 "10" 2 "100" 3 
"1,000" 4 "10,000", grid) legend(off) 
xtitle("Population per square mile") 


ytitle("Percent vote for GW Bush") 
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الشكل )2.13( 


كما يؤكد الشكل )2.13( فنسبة التصويت لصالح جورج بوش تميل 
لتكون أقل في المناطق ذات الكثافة السكانية العالية والمقاطعات المتحضرة 
كما ud‏ ميل ali Laud‏ أقل في المقاطعات التي بها نسبة كبيرة من 
الأقليات العرقية أو نسبة أكبر من البالغين Spa esie zd‏ جافعياً. 


.regress bush logdens minority colled 
























Source Number of obs - 3041 
F( 3, 3037) - 345.39 

Model 122345.617 3 40781.8725 Prob » F = 0.0000 
Residual 358593.826 3037 118.075017 R-squared - 0.2544 
Adj R-squared = 0.2537 

480939.443 3040 158.203764 Root MSE = 10.866 













Coef. Std. Err. t P»|t| [95$ Conf. Interval] 









logdens -5.457462 -3031091 -18.00 0.000 -6.051781 -4.863142 
minority = 251151 .0125261 -20.05 0.000 -.2757115 -.2265905 
colled -.1811345 .0334151 -5.42 0.000 -.246653 -.115616 
-cons 75.18636 -5739508 132.04 0.000 74.66099 76.91173 








(Gli مع برنامج‎ play} 608 





في صيغ النموذج المختلط؛ نقوم بتقدير نموذج يحتوي على تأثيرات 
ثابتة «des‏ ويكون التقاطع والمُعاملات تفسر العينة ككل. ونفس نموذج 
التأثير ات الثابتة يمكن تقديرها باستخدام الأمر xtmixed‏ مع نفس تركيبة 


الأمر السايق. 

.xtmixed bush logdens minority colled 
Mixed-effects ML regression Number of obs = 3041 
Wald chi2(3) = 1037.53 
Log likelihood - -11567.783 Prob » chi2 = 0.0000 
















Coef. Std. Err. [95$ Conf. Interval] 





logdens -5.457462 .3029097 -18.02 0.000 -6.051154 -4.86377 


minority -.251151 .0125179 -20.06 0.000 -.2756856 -.2266164 
colled -.1811345 .0333931 -5.42 0.000 -.2465838 -.1156852 
-cons 75.78636 .5735732 132.13 0.000 74.66217 76.91054 















Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 









.1392419 10.58958 11.13545 


الاحتمالية القصوى (ML)‏ هي طريقة التقدير الافتراضية للأمر «xtmixed‏ 
ولكن قد يتم تحديده بشكل خاص مع خيار amt‏ أو بشكل آخر فإن الخيار 
reml‏ يمكن استخدامه لتقدير الاحتمالية القصوى المقيّدة» وللحصول على قائمة 
بالتقديرات والخيارات المتعلقة بها قم بطباعة الأمر „help xtmixed‏ 

النمط أو الاتجاه الجغرافي للتصويت يمكن رؤيته في الخرائط بألوان 
زرقاء وحمراء لهذه الانتخابات» والتي لم يتم حسابها بواسطة نموذج 
التأثيرات الثابتة أعلاه؛ والذي يفترض gh‏ التقاطع وقيم الميل هي نفسها لكل 
1 مقاطعة في هذا um‏ ا َه الأخرى | لصياغة mad ON‏ 
| ات الثابتة Pm‏ مثل: 


y; = Bo + Bx + Bax», + PyXut €, [1.13] 


10.85908 





sd (Residual) 
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يمكننا تضمين ليس فقط مجموعة مُعاملات م التي تفسّر كل المقاطعات» 
وإنما Laf‏ تقاطع عشوائي wy‏ يتغير من تقسيم سكاني إلى آخر. 

Jy = Po + 2 + Ex + زرك ع نو‎ ]2.13[ 

المعادلة ]2.13[ تصوّر قيمة المتغير US y‏ مقاطعة i‏ وكل تقسيم سكاني J‏ 
كدالة لتأثيرات المتغيرات x2, x]‏ ,3× والتي هي نفسها لكل التقسيمات. التقاطع 
العشوائي uy‏ يسمح لاحتمالية أن تكون نسبة متوسط الانتخاب لجورج بوش 
أعلى أو أقل بانتظام بين المقاطعات لبعض التقسيمات» هذا يبدو مناسبا 
لانتخابات الولايات المتحدة عند الأخذ بالاعتبار الأنماط الجغرافية الواضحة» 
كما يمكننا تقدير نموذج مع تقاطعات عشوائية لكل تقسيم سكاني؛ وذلك 
بإضافة جزء من تأثيرات عشوائية جديدة إلى الأمر ixtmixed‏ 

.xtmixed bush logdens minority colled || cendiv: 
Performing EM optimization: 


Performing gradient-based optimization: 


Iteration 0: log likelihood = -11339.79 
Iteration 1: log likelihood = -11339.79 (backed up) 
Computing standard errors: 
Mixed-effects ML regression Number of obs = 3041 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 67 
avg = 337.9 
max = 616 
Wald chi2(3) = 1161.96 
Log likelihood = -11339.79 Prob > chi2 = 0.0000 










Coef. Std. Err. P»|z| [95$ Conf. Interval] 









logdens -4.52417 -3621775 -12.49 0.000 -5.234025 -3.814316 
minority -.3645394 .0129918 -28.06 0.000 -.3900029 -.3390758 
colled -.0583942 .0357717 -1.63 0.103 -.1285053 .011717 
-cons 72.09305 2.29404 31.43 0.000 67.59682 76.58929 














Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval 






cendiv: Identity 


sd(. cons) 6.617137 1.600468 4.119007 10.63036 









sd (Residual) 10.00339 


.1284657 9.754742 10.25837 





LR test vs. linear regression: chibar2(01) = 455.99 Prob >= chibar2 = 0.0000 
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الجزء السابق من جدول مخرجات xtmixed‏ يعرض جزء التأثيرات 
الثابتة للنموذج. هذا النموذج يقوم بتطبيق تسعة تقاطعات متفرقةء حيث يوجد 
هناك تقاطع لكل تقسيم سكاني» ولكن لم يتم تقديرها Vang cb plas‏ من ذلك 
فإن الجزء السفلي من الجدول يعطي الانحراف المعياري المقتر للتقاطعات 
العشوائية (6.62) مع خطأ معياري )1.60( وفترة ثقة 9695 لذلك الانحراف 
المعياري» وبذلك يصبح النموذج كما يلي: 


bushy = 12.09 — 4.52logdensy— 0.36minority,— 0.06colled;* Uy + €; ]3.13[ 


إذا ظهر الانحراف المعياري ل m‏ يختلف جوهرياً عن الصفرء فيمكنتا 
أن نستنتج بأن هذه التقاطعات تتنوع من مكان لآخرء وهذا ما يبدو عليه 
الوضع هنا. حيث إن الانحراف المعياري أكبر من أربعة أخطاء معيارية من 
الصفرء وقيم هذا الانحراف جوهرية (6.62 نقطة مئوية) للمتغير التابع وهو 
نسبة التصويت لجورج بوشء اختبار نسبة الأرجحية العظمى يظهر في آخر 
سطر بجدول المخرجات» والذي يؤكد بأن نموذج التقاطع العشوائي 
شهد تطورا Das‏ عن أي نموذج انحدار خطي مع تأثيرات ثابتة Loa‏ 
.(p = 0.0000)‏ 
بالرغم من أن الأمر xtmixed.‏ لا يحسب التأثيرات العشوائية بطريقة 
مباشرة» ولكن يمكننا الحصول على أفضل توقعات خطية غير متحيزة 
(BLUPS)‏ للتأثيرات العشوائية من خلال الأمر predict‏ الأوامر أدناه تقوم 
بإنشاء متغير جديد باسم randintü‏ يحتوي على التقاطعات العشوائية المتوقعة 
ثم يقوم بإنشاء رسم بياني لكل تقاطع عشوائي مع كل تقسيم سكاني في الرسم 
البياني للأعمدة (الشكل 3.13). 
.predict randint0, reffects‏ 


.graph hbar (mean) randint0, over(cendiv) 
ytitle("Random intercepts by census division") 
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الشكل )3.13( 


الشكل (3.13) يوضح بأنه عند أي مستوى من مستویات logdens,‏ 
minority, colled‏ نسبة الأصوات التي ذهبت لصالح بوش كانت بمتوسط 15 
نقطة E JÍ‏ مقاطعات نيو إنجلاند New England‏ وأكثر من 8 نقاط في 
المقاطعات الوسطى في الجنوب الغربي (مقاطعات Arkansas, Louisiana,‏ 
(Oklahoma, Texas‏ مقارنة مع منتصف الطريق وهو تقسيم المنطقة الوسطى 
للشمال الغربي 
النقاطعات doblo‏ العشوائية : Random Intercepts and Slopes‏ 


في الشكل )2.13( رأينا - بأنه وبصفة dale‏ - أن نسبة الناخبين لصالح 
بو quM PEE‏ كلما يمه الكثافة السكانية. نموذج التقاطع العشوائي 

في الجزء السابق وافق على هذه النتيجة» وسمح للتقاطعات بأن تتغير حسب 
المناطق. ولكن ماذا لو كان ميل العلاقة بين الكثافة والانتخاب يتغير Lai‏ 
بتغير المناطق؟ نظرة سريعة على شكل الانتشار لكل منطقة (الشكل 4.13) 
يعطينا مبررا للشك Gl‏ ذلك قد يحدث. 
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.graph twoway scatter bush logdens, msymbol (Oh) 
|| 1fit bush logdens, lwidth(medthick) 
|| , xlabel(-1(1)4, grid) ytitle("Percent 
vote for GW Bush") 
by(cendiv, legend(off) note("")) 
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الشكل )4.13( 


أصوات بوش تنخفض بدرجة كبيرة مع زيادة الكثافة السكانية في 
المناطق الوسطى والشمالية الغربية ومنطقة المحيط الهادئ. ولكن يبدو أن 
هناك علاقة ضعيفة في المناطق الوسطى الشمالية الشرقية» وحتى هناك تأثير 
موجب في المناطق الوسطى الجنوبية الشرقية. معامل التأثير الثابت السالب 
للمتغير Jogdens‏ في النموذج السابق كان متوسطاً لهذه الاتجاهات المنخفضة 
S dfi‏ والموفعة Jes‏ 

يمكن إنشاء نموذج مختلط يتضمن قيم ميل عشوائية (uy)‏ للمتغير 
التنبؤي × والتقاطعات العشوائية (uy)‏ لكل مجموعة من مجموعات j‏ وتكون 
صيغته العامة كما يلي: 


y^ Bo + Bixry + Bxxay + Pts + Uy gj + Ey [4.13] 
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ولتوضيح مثل هذا EA gail‏ سوف نقوم بإضافة متغير تنبؤي logdens‏ 
لجزء التأثير المختلط بالأمر -xtmixed‏ 


.xtmixed bush logdens minority colled || cendiv: 
logdens 


Performing EM optimization: 


Performing gradient-based optimization: 


Iteration 0: log likelihood - -11298.734 
Iteration 1: log likelihood - -11298.734 
Computing standard errors: 
Mixed-effects ML regression Number of obs - 3041 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 67 
avg = 337.9 
max = 616 
Wald chi2 (3) = 806.25 
Log likelihood - -11298.734 Prob » chi2 = 0.0000 











(95% Conf. Interval] 







logdens -3.310313 1.114965 -2.97 0.003 -5.495605 -1.125021 
minority -.3616886 .0130709 -27 7 0.000 -.387307 -.3360702 
colled -.1173469 .0360906 -3.25 0.001 -.1880833 -.0466105 
-cons 70.12095 2.955209 23.73 0.000 64.32885 75.91305 





















Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval 









cendiv: Independent 
sd(logdens) 
sd(_cons) 


3,213575 .8143897 1.86474 5.198768 
8.5913 2.232214 5.162945 14.29619 

















9.825565 .1264176 9.580889 10.07649 





sd (Residual) 


LR test vs. linear regression: chi2(2) = 538.10 Prob » chi2 - 0.0000 


Note: LR test is conservative and provided only for reference. 


وكما هو معتادء فإن التأثيرات العشوائية لم يتم تقديرها مباشرة؛ وبدلاً 
من ذلك» فإن جدول مخرجات الأمر xtmixed‏ يعرض تقديرات لانحرافاتها 
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المعيارية. الانحراف المعياري لمُعاملات لوغاريتم الكثافة هو 3.11-و 
قريب أبعد أربع مرات من الأخطاء المعيارية )0.81( nes‏ 
يشير إلى وجود تباين ذي معنوية بين تقسيمات السكان في مُعاملات الميل» 
ولإجراء هذا الاختبار» سوف نقوم بإعادة تقدير تقاطع bo‏ ويتم حفظ 
هذا التقدير باسم 4 (اسم تم اختياره (Lil pte‏ ثم نقوم بإعادة 3 تقدير ميل 
وتقاطع النموذج وحفظ هذه التقديرات باسم ‘B‏ وكيوا نقوم بحساب mde‏ 
معدل الأرجحية العظمى لمعرفة ما إذا كان 8 يتناسب بدرجة أفضل من 
تناسب cA‏ وهذا ما حدث فعلا في هذا المثال )0.0000 = (p‏ ولذا فإننا نستنتج 
Er‏ إضافة قيم ميل عشوائية يقوم بتطوير النموذج بصورة كبيرة. 
.quietly xtmixed bush logdens minority colled‏ 
cendiv:‏ || 
-estimates store A‏ 
.quietly xtmixed bush logdens minority colled‏ 
cendiv: logdens‏ || 
.estimates store B‏ 
.lrtest A B‏ 
Likelihood-ratio test LR chi2(1) = 82.11‏ 
(Assumption: À nested in B) Prob» chi2 = 0.0000‏ 


Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 





مخرجات الأمر Irtest.‏ تحذرنا بأن هناك "افتراضاً أن كل فرضيات العدم 
ليست ضمن حدود مساحة المعلمية" . وبخلاف ذلك» فإن الاختبار الناتج سوف 
يكون محافظاً على هذه الحدود. كلتا الملاحظتين تشيران إلى نفس القضية 
الإحصائية» فالتباين لا يمكن أن يكون أقل من الصفر. ولذا فإن فرضية العدم 
القائلة بأن cal‏ يساوي صف رأ تقع is gui‏ المساحة المعلمية. . في هذه 
الحالة الاحتمالية التي نتجت من اختبار معدل الأرجحية العظمى تمثل fre‏ 
أعلى 'محافظاً على be‏ الاحتمال الواقعي؛ الأمر xtmixed‏ يكتشف هذا 
الوضع بشكل تلقائي» وهذا لا يمكن القيام به باستخدام الأمر sIrtest‏ 
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النموذج السابق يفترض أن قيم الميل والتقاطعات العشوائية غير 
Alas) yin‏ وهذا يُكافئ إضافة الخيار cov(independent)‏ الذي يُحدد تركيبة 





التباين المصاحب. الاحتمالات الأخرى تتضمن cov(unstructured)‏ والذي 
يسمح بتوضيح التباين المصاحب الذي لايساوي Bia‏ بين التأثيرات 
العشوائية. 
.xtmixed bush logdens minority colled‏ 
cendiv: logdens, cov(unstructured)‏ || 


Performing EM optimization: 
Performing gradient-based optimization: 


Iteration 0: log likelihood = -11296.31 
Iteration 1: log likelihood -11296.31 (backed up) 


Computing standard errors: 


Mixed-effects ML regression Number of obs = 3041 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 67 

avg = 337:9 

max = 616 

Wald chi2(3) = 799.68 

Log likelihood = -11296.31 Prob > chi2 = 0.0000 












Coef. Std. Err. 2 P»|z| [95$ Conf. Interval] 













logdens -3.150009 1.169325 -2.69 0.007 -5.441844 -.858175 


minority -.3611161 + 0130977 -27.57 0.000 -.3867872 -.3354451 
colled -.1230445 .0361363 -3.41 0.001 -.1938704 -.0522186 
-cons 69.85194 3.168479 22.05 0.000 63.64184 76.06204 












Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 
cendiv: Unstructured 

sd (1ogdens) 3.282749 .8547255 1.970658 5.468447 

sd(. cons) 9.240389 2.402183 5.551459 15.3806 

corr(logdens,, cons) -.675152 . 1958923 -.909687 -.1140965 


sd (Residual) .823658 .1263468 9.579118 10.07444 
LR test vs. linear regression: chi2(3) = 542.95 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 
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الترابط المقدّر بين الميل العشوائي للمتغير logdens‏ والتقاطع العشوائي 

هو 0.675- وهو يبعد عن الصفر بأكثر من ثلاثة أخطاء معيارية. اختبار 

معدل الأرجحية العظمى يتفق مع القول بأن السماح بهذا الترابط ينتج عنه 
تطوّر ذو معنوية (0.277 = م) في النموذج الحالي عن النموذج السابق. 

.estimates store C 

.lrtest B C 


Likelihood-ratio test LR chi2(1) 
(Assumption: B nested in C) Prob » chi2 





4.85 
0.0277 


النموذج الحالي هو: 
bushy = 69.85 — 3.15 logdens;; — 0.36 minority; — 0.12 colledy + uo‏ 
uylogdensy + €; [5.13]‏ + 
إذن ما الذي تقوم به قيم الميل لربط التصويت مع الكثافة لكل تقسيم 
سكاني؟ مرة أخرى يمكننا الحصول على قيم التأثيرات العشوائية (تم تسميتها 
randint] s‏ و (randslo1‏ من خلال الأمر «predict‏ فالبيانات التي نقوم 
باستخدامها الآن أصبحت تحتوي على مجموعة متغيرات جديدة. 
.predict randsloirandinti, reffects‏ 





.describe 
Contains data from C:\data\election_2004i.dta 
obs: 3,054 US counties -- 2004 election (Robinson 2005) 
vars: 17 23 Feb 2014 01:37 
size: 265,698 
storage display value 
variable name type format label variable label 
fips long $9.0g FIPS code 
state str20 585 State name 
state2 str2 %9s State 2-letter abbreviation 
region byte $9.0g region Region (4) 
cendiv byte $15.0g division Census division (9) 
county str24 %24s County name 
votes float %9.0g Total # of votes cast, 2004 
bush float 59.09 % votes for GW Bush, 2004 
logdens float 59.09 10g10 (people per square mile) 
minority float %9.0g $ population minority 
colled float 59.09 $ adults »25 w/4* years college 
randintO float %9.0g BLUP r.e. for cendiv: . cons 
.est C byte $8.0g esample() from estimates store 
.est A byte %8.0g esample() from estimates store 
.est.B byte — $8.0g esample() from estimates store 
randslol float %9.0g BLUP r.e. for cendiv: logdens 
randintl float 59.09 BLUP r.e. for cendiv: _cons 


Sorted by: fips 
Note: dataset has changed since last saved 
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مُعاملات الميل العشوائي تتراوح من 5.45- للمقاطعات في تقسيم 
المنطقة الوسطى الشمالية الغربية W North Central‏ إلى 4.49+ في المنطقة 
الوسطى الجنوبية الشرقية -E South Central‏ 


.table cendiv, contents (mean 23221051601 mean 
randint1) 







Census division 


(9) mean(randslol)  mean(randintl) 













+ 8396833 -16.95975 
.0018003 -2.339407 


New England 
Middle Atlantic 


E North Central 3.510326 -8.810173 
W North Central -5.453928 7.912671 
South Atlantic 1.870723 2.622947 
E South Central 4.493841 -4.029463 
W South Central -.5490148 10.37175 
Mountain 71473396 6.80135 





Pacific 4.430075 





-2.979471 


لتوضيح العلاقة بين التصويت والكثافة السكانية يمكننا إعادة تنظيم 
المعادلة [5.13] بدمج قيم الميل العشوائي والثابت للمتغير ‘logdens‏ 


bushy= 69.85 + (u-3.15) logdens;; — 0.36minority; — 0.12colledy + uo; + €j [6.13] 


بعبارة أخرىء الميل لكل تقسيم سكاني يساوي ميل التأثير الثابت للعينة 
بالكامل زائداً ميل التأثير العشوائي لكل تقسيم سكاني. فمثلاً ضمن المقاطعات 
المطلّة على المحيط الهادئ نجد أن قيمة الميل الموحد هي 6.37- = 3.22 - 3.15-» 

قيم الميل yall‏ 554 التسعة تم حسابها وتمثيلها بيانياً في الشكل (5.13). 
1 ]ط_ + .gen 510261 = randslol‏ 


.graph hbar (mean) slopei, over(cendiv) 


ytitle("Change in % Bush vote, with each 
tenfold increase in density") 
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New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 

E South Central 
W South Central 


Mountain 


L 


Pacific 





ur udi cM BR x» B‏ 1 1 ا 


-8 -6 4 -2 0 2 
Change in % Bush vote, with each tenfold increase in density 


الشكل )5.13( 


الشكل (5.13) يعرض كيف أن التدرج بين الريف والحضر في السلوك 
الانتخابي يختلف من مكان لآخرء في المقاطعات الوسطى الشمالية الغربية 
والمناطق الجبلية والمطلة على المحيط الهادئ كانت نسبة المصوتين لبوش 
انخفضت بشكل حاد كلما زادت الكثافة السكانيةء LA‏ في المناطق الوسطى 
الشمالية الشرقية والوسطى الجنوبية الشرقية فقد كانت النسبة في الاتجاه 
(RI‏ حيث زادت أصوات بوش بدرجة بسيطةء قيم الميل الموحدة في 
الشكل (5.13) تشابه بشكل عام تلك التي تظهر في الشكل (4.13) ولكن لا 
تتطابق بالضبط لأن قيم الميل الموحدة (المعادلة ]6.13[ أو الشكل 5.13) تم 
Lea‏ تعديلها بالنسبة لتأثير الأقليات وخريجي الجامعات. في الجزء التالي 
سوف نقوم بدراسة ما )13 كانت هذه التأثيرات لها مكونات عشوائية. 


قيم dbl‏ العشوائية اطتعددة : Multiple Random Slopes‏ 
لتحديد المُعاملات العشوائية للمتغيرات logdens, minority, colled‏ يمكننا 


ببساطة إضافة أسماء هذه المتغيرات إلى جزء التأثيرات العشوائية للأمر 
«xtmixed‏ لغرض إجراء اختبارات المقارنة. لاحقا سوف نقوم بحفظ نتائج 
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التقدير باسم dull‏ وهناك بعض التفاصيل المكررة تم إهمالها في المخرجات 





التالية: 
.xtmixed bushlogdens minority colled‏ 
cendiv: logdens minority colled‏ || 
Performing EM optimization:‏ 
Performing gradient-based optimization:‏ 
Iteration 0: log likelihood = -11184.804‏ 
Iteration 1: log likelihood = -11184.804‏ 
Computing standard errors:‏ 
Mixed-effects ML regression Number of obs = 3041‏ 
Group variable: cendiv Number of groups = 9‏ 
Obs per group: min = 67‏ 
avg = 337.9‏ 
max = 616‏ 
Wald chi2(3) = 52.49‏ 
Log likelihood = -11184.804 Prob > chi2 = 0.0000‏ 











Std. Err. 





Coef. {95% Conf. Interval] 












logdens -2.717128 1.373684 -1.98 0.048 -5.409499 -.0247572 


minority -.3795605 . 0560052 -6.78 0.000 -.4893286 -.2697924 
colled -.1707863 .1727742 -0.99 0.323 -.5094175 .167845 
_cons 70.86653 3.435918 20.63 0.000 64.13225 71.6008 




















Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval 


cendiv: Independent 


sd(logdens) 3.868421 + 9832899 2.350564 6.366421 
sd(minority) .153172 .0439569 .0872777 .2688161 
sd(colled) .5032414 .1241234 .310334 .8160625 
sd(. cons) 10.01157 2.547813 6.079707 16.48625 








sd (Residual) 9.375994 .1209753 9.141859 9.616124 





LR test vs. linear regression: chi2(4) = 765.96 Prob > chi2 = 0.0000 
Note: LR test is conservative and provided only for reference. 


.estimates store full 
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باعتبار نموذج LAS full‏ أساسي» فإن اختبارات معدل الأرجحية 
العظمى تحدد Er‏ المُعاملات العشو ائية للمتغيرأت logdens, minority, colled‏ 
كل منها لها اختلاف ذو معنوية إحصائية. ولذا فإن هذه الاختلافات يجب 
الاحتفاظ بها بالنموذجء فمثلاً لتقييم التأثيرات العشوائية للمتغير ccolled‏ فإننا 
نقوم بتقدير نموذج جديد بدونها (nocolled)‏ ثم نقارن ذلك النموذج مع نموذج 
Ul full‏ نموذج nocolled‏ يتناسب بطريقة أسوأ بكثير )0.0000 = (p‏ من نموذج 
full‏ الذي رأيناه سابقا. 


.quietly xtmixed bush logdens minority colled 
|| cendiv: logdens minority 

.estimates store nocolled 

.lrtest nocolled full 


Likelihood-ratio test LR chi2(1) = 197,33 


(Assumption: nocolled nested in full) Prob > chi2 = 0.0000 


Note; The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 


خطو ات متشابهة مع نموذجين آخر ين .(nominority 5 nologdens)‏ 
واختبارات معدل الأرجحية العظمى توضح بأن نموذج full‏ أيضاً يتتاسب 
بشكل أفضل بكثير من النماذج التي كانت بدون مُعامل عشوائي للمتغير 
logdens‏ أو بدون مُعامل عشوائي للمتغير minority‏ 

.quietly xtmixed bush logdens minority colled 
|| cendiv: minority colled 


.estimates store nologdens 
.lrtest nologdens full 


Likelihood-ratio test LR chi2(1) = 124.81 
(Assumption: nologdens nested in full) Prob» chi2 = 0.0000 


Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 


يمكننا التحقق من أن تفاصيل كل هذه التأثيرات العشوائية أو التأثيرات 
المدمجة التي ظهرت في النتائج من خلال حسابات وخطوط لتلك التي تم 
عرضها سابقا في الشكل (5.13). 
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بحوث النماذج المختلطة في العادة تركز على التأثيرات الثابتة مع 
التأثير ات العشوائية والتي يتم إدراجها لتمثل عدم التجانس heterogeneity‏ في 
البيانات وليس لأي أسباب موضوعية أخرى. فعلى سبيل «QUSS‏ التحاليل 
التي قمنا بها حتى الآن أظهرت بأن الكثافة السكانية ونسبة الأقليات ونسبة 
خريجي الجامعات يُمكنها أن تتنباً بنمط التصويت في المقاطعة حتى بعد 
الأخذ في الاعتبار الاختلافات الإقليمية في متوسط الأصوات والاختلافات 
الإقليمية في الكثافة وخريجي الجامعات. ومن ناحية أخرىء فإن التأثيرات 
العشوائية هي نفسها لها أهمية. ولمعرفة كيف أن العلاقة بين التصويت 
ونسبة خريجي الجامعات (نسبة الأقليات أو لوغاريتم الكثافة السكانية) يختلف 
بين التفسيمات السكانية فيمكننا أن نتوقع التأثيرات العشوائية من خلال حساب 
التأثير الكلي. هذه الخطوات تم شرحها للتأثير الكلي لمتغير colled‏ على 
النموذج أدناه بالكامل» وتمثيلها بيانياً في الشكل (6.13). 

.quietly xtmixed bush logdens minority colled 

|| cendiv: logdens minority colled 

predict relogdens reminority recolled re cons, 


reffects 
.describe relogdens-re cons 


storage display value 
variable name type format label variable label 
T ————————————————————————— 
relogdens float %9.0g BLUP r.e. for cendiv: logdens 
reminority float %9.0g BLUP r.e. for cendiv: minority 
recolled float $9.0g BLUP r.e. for cendiv: colled 
re cons float $9.0g BLUP r.e, for cendiv: | cons 


.generate tecolled = recolled +  b[colled] 
-label variable tecolled "random + fixed effect 
of colled" 

.table  cendiv, contents(mean  recolled mean 
tecolled) 
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Census division 


(9) mean(recolled) mean(tecolled) 











New England +2411761 .4119623 
Middle Atlantic -.0849539 -.2557401 
E North Central -.0682224 -.2390087 
W North Central .4122158 .2414226 

South Atlantic -.1243222 -.2951084 
E South Central .4856058 . 5 
W South Central .9054216 . 7346353 

Mountain =. 1295713 -.9063575 
Pacific .5489974 -.7197837 






.graph hbar (mean) tecolled, over(cendiv) 
ytitle("Change in % Bush vote, per 1% 
increase in college graduates") 


New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 

E South Central 


W South Central 


Mountain 
Pacific i 
eeg 
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Change in % Bush vote, per 1% increase in college graduates 


الشكل )6.13( 





=f BR 


| 


الشكل )6.13( يعرض بيانياً سبب التطور الكبير الذي حدث في النموذج 
(p = 0.0000)‏ بعد إضافة ميل عشوائي للمتغير colled‏ التأثيرات الكلية للمتغير 
4 على أصوات بوش تتراوح من سالب بدرجة كبيرة (نسبة أصوات بوش 
منخفضة في المقاطعات التي بها خريجو جامعات أكثر) في الجبل Mountain‏ 
)70.91( والمحيط الأطلسي Pacific‏ (0.72-) ذات الكثافة السكانية إلى بسيطة 
هذا وغير ملحوظة في مناطق جنوب المحيط الأطلسي al South Atlantic‏ 
المنطقة الوسطى الشمالية الغربية W North Central‏ ثم إلى موجبة بدرجة كبيرة 
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ee‏ و و 


)0.73*( في المناطق الوسطى الجنوبية الغربية cas W South Central‏ 
أصوات بوش كانت مرنفعة بدرجة كبيرة في تلك المقاطعات التي بها خريجو 
جامعات أكثرء مع ملاحظة التحكم في الكثافة السكانية ونسبة الأقليات 
والتأثيرات الإقليمية الأخرىء إذا قمنا بتقدير تأثير cu‏ للمتغير colled‏ فإن 
النموذج سوف يقوم بكفاءة بحساب متوسط التأثيرات السالبة التي تقترب من 
الصفرء والتأثيرات العشوائية الموجبة للمتغير colled‏ في معامل ثابت موجب 
أسبوعي واحدء ويكون المعامل بالضبط 0.18- في انحدارات التأثيرات الثابتة 
الاثنين التي بدأنا بها في هذا الفصل. 

الأمثلة التي رأيناها حتى الآن تم التعامل معها بشكل ناجح بواسطة 
الأمر cxtmixed‏ ولكن هذا ليس هو الوضع دائماًء فتقدير نموذج = Ste‏ 
أن يفشل في المعالجة لعدة أسباب Loge‏ إلى تكرار"عدم الانحناء" أو "التراجع" 
أو رسائل خطأ حول Hessian‏ أو حسابات الأخطاء المعيارية. دليل المستخدم 
Longitudinal/Panel Data Reference Manual‏ يُناقش كيفية تشخيص ومعالجة 
مشاكل التقارب «convergence‏ والسبب المتكرر يبدو هو اقتراب مكونات 
تباين النماذج من الصفر مثل المعاملات العشوائية التي لا تتباين بدرجة 
كبيرة أو لها تباين منخفض. في مثل هذه الحالات» فإن المكونات المسببة 
لهذه المشكلة يمكن استبعادها بدرجة معقولة. 


Nested Levels : أطسئويات اطتشابكة‎ 





إنماذج التأثيرات الثابتة يمكن تضمينها أكثر من مستوى متشابك واحد. 
فمتلا المقاطعات فير بيانات الانتخابات ليست متشابكة فقط مع تقسيمات 
السكان» ولكنها أيضاً مع الولايات والتي هي متشابكة مع تقسيمات السكان. 
هل التأثيرات العشوائية 1i $352 5a‏ .عن Jua.‏ ى )تساك اكان ld‏ 
عند مستويات أقل من الولايات؟ الأمر xtmixed‏ يسمح Jia‏ هذه النماذج 
الهرمية. فأجزاء التأثيرات العشوائية الإضافية تم إضافتها للأمر مع وحدات 
(متشابكة) أصغر على التوالي إلى اليمين. التحليل التالي يحدد التقاطعات 
العشوائية» وقيم الميل في المتغيرات التنبؤية الثلاثة لكل تقسيم سكاني» وأيضاً 
التقاطعات العشوائيةء وقيم الميل لنسبة خريجي الجامعات colled‏ لكل ولاية. 

.xtmixed bush logdens minority colled 
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ا کاک ا 


cendiv: logdens minority colled 
state: colled 


Performing EM optimization: 





Performing gradient-based optimization: 

Iteration 0: log likelihood - -10719.828 
Iteration 1: log likelihood = -10719.821 
Iteration 2: log likelihood - -10719.821 


Computing standard errors: 


Mixed-effects ML regression Number of obs = 3041 








No. of Observations per Group 
Group Variable Groups Minimum Average Maximum 
cendiv 9 67 337.9 616 


state 





68.85 
0.0000 


Wald chi2(3: 
Log likelihood = -10719.821 Prob » chi2 


0 















Coef. Std. Err. z P»|z| [95$ Conf. Interval 





logdens -2.473536 .996434 -2.48 0.013 -4.426511 -.5205616 
minority -.4067648 .0533714 -7.62 0.000 -.5113709 -.3021588 
colled -.1787849 .1298313 -1.38 0,168 -.4332495 .0756797 
_cons 71.13208 3 048286 23.34 0,000 65.15755 77.10661 


eee 


Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 


cendiv: Independent 


sd(logdens) 2.703845 771272715 1.544252 4.734186 
sd(minority) .1465435 .0428326 .0826365 .2598728 
sd(colled) .3683903 .0962733 .220729 .6148326 
sd( cons) 8.416873 2.417524 4.793643 14.77869 












state: Independent 
.1305727 .039009 .0727032 .2345047 
5.883451 .7431715 4.593166 7.536196 


sd(colled) 
sd(. cons) 












sd(Residual) 7.863302 .1027691 7.664436 8.067328 


LR test vs. linear regression: chi2(6) = 1695.92 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 
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عند إلقاء نظرة سريعة على كل التأثيرات العشوائية لكلا المتغيرين» فإن 
المتغيرين cendiv, state‏ في المخرجات أعلاه يبدو أنهما ذات cAy gine‏ وهذا 
يبدو واضحاً من خلال فترات الثقة والأخطاء المعيارية لهذين المتغيرين. 
الانحراف المعياري للمعاملات العشوائية عند مستوى الولايات للمتغير 
colled‏ )0.13( أقل من الانحراف المعياري للمعاملات العشوائية عند مستوى 
تقسيمات السكان (0.37) ولكن LUIS‏ متعلق بدرجة كبيرة بمعامل التأثير 
العشوائي للمتغير LÍ »)-0.18( colled‏ فترة الثقة لمعامل مستوى الولاية 
فيتراوح ما بين 0.07 إلى 0.23» واختبار معدل الأرجحية العظمى يُشير إلى 
أن هذا النموذج (والذي يُسمى هنا (state‏ مع تقاطعات عشوائية لمستوى 
الولاية وقيم ميل أكثر تناسباً من النموذج السابق (full)‏ والذي كان له 
تقاطعات عشوائية لمستوى تقسيمات السكان وقيم الميل. 


.estimates store state 
.lrtest full state 


Likelihood-ratio test LR chi2(2) 
(Assumption: full nested in state) Prob » chi2 


= 929.97 

z 0.0000 

Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 





لحساب ورسم التأثيرات الكلية» بالنسبة للمتغير colled‏ لدينا الآن تأثيرات 
عشوائية من 49 ولاية مختلفة» الرسم البياني الصندوقي يمثل التوزيع 
بطريقة جيدة (الشكل 7.13( والذي يتبع نمطا عاما لتأثيرات تقسيم السكان 
الذي رأيناه سابقاً في الشكل (6.13) ولكنه الآن مع تباين لكل تقسيم. ففي 
الرسم البياني تظهر إنديانا (المنطقة الوسطى الشمالية الشرقية) وأوكلاهوما 
(المنطقة الوسطى الجنوبية الغربية) كقيم متطرفةء GY‏ كلا منهما يظهر 


بصورة غير معتادة في تقسيمه الخاص. 


وكما تم سابقاًء فإنه يمكننا أن نتوقع التأثيرات العشوائية ثم نستخدمها 


.predict re*, reffects 
.describe rei-re6 
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stcrage display value 
variable name type format label variable label 
rel float %9.0g BLUP r.e. for cendiv: logdens 
re2 fioat %9.0g BLUP r.e. for cendiv: minority 
re3 float %9.0g BLUP r.e. for cendiv: colied 
re4 float %9.0g BLUP r.e. for cendiv: _cons 
re5 float $9.0g BLUP r.e. for state: colled 
re6 float %9.0g BLUP r.e. for state: . cons 


.gen tecolled2 = re3 + re5 + _b[colled] 

.label variable tecolled2 

"cendiv + state + fixed effect of % college 
grads" 

.graph hbox tecolled2, over(cendiv) yline(-.16) 
marker(1, mlabel(state)) 


New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 


E South Central 





W South Central [| eovanoa 


Mountain 





Pacific 


-1 


-5 0 
cendiv + state + fixed effect of % college grads 
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ولمعرفة أدوات ما قبل التقدير الأخرى xtmixed‏ قم بطباعة الأمر help‏ 
«xtmixed. postestimation‏ كما أن دليل Longitudinal/Panel Data pimal‏ 
Reference Manual‏ وكتاب Rabe-Hesketh and Skrondal‏ )2012( تعرض 
تطبيقات عن صياغة النماذج المختلطة مثل هياكل التغاير القُطريّة A lia‏ 
ونماذج التأثيرات المقطعية. 


الفصل الثالث عشر : صياغة نماذج التأثيرات المختلطة والمستويات المتعددة 627 
Se Eee‏ 


Repeated Measurements : اطتكررة‎ uuu labl 


الملف attract2.dta‏ يحتوي على بيانات لتجربة غريبة تم إجراؤها في 
احتفال لطلبة بالجامعةء وخلال هذا الحفل يقوم الطلبة بتتاول oaa‏ 
المشروبات» في هذه التجربة تم سؤال 15 طالباً جامعياً ليقوموا بتقييم فردي 
iila‏ سور رجال رسام ei pu‏ على odia‏ من 1 إلى 0 تم JIS‏ 
عملية التقييم لكل مشارك من خلال إعطائه نفس الصور بعد خلطها عشوائيا 
أربع مرات خلال فترة المساء. المتغير ratemale‏ يمثل متوسط التقييم الذي 
أعطاه كل مشارك لكل صور الذكور في جلسة واحدة. والمتغير ratefem‏ 
يمثل متوسط التقييم الذي تم إعطاؤه لصور الإناث. المتغير gender‏ يُسجل 
جنس المشارك نفسه» والمتغير bac‏ يسجل نسبة الكحول في pall‏ والذي sl‏ 

بجهاز قياس الكحول في الدم. 
.use C:\data\attract2.dta, clear‏ 


-describe 
Contains data from C:\data\attract2.dta 
obs: 204 Perceived attractiveness and drinking -- pc 
Hamilton (2003) 
vars: 7 2 Jul 2012 06:11 
size: 3,876 
storage display value 
variable name type format label variable labei 
id byte %9.0g Participant number 
yender byte %9.0g gender Gender 
bac float %9.0g Blood alchohol content 
single byte — $9.0g single Relationship status single 
drinkfrg float %9.0g Days drinking in previous week 
ratefem float %9.0g Rated attractiveness of females 
ratemale float $9.0g Rated attractiveness of males 


Sorted by: id bac 


فرضيات البحث تتضمن أن "أكواب aa‏ لها تأثير على تقييم 
المشارك: هل الغرباء يُصبحون أكثر جاذبية إذا قام المشارك بشرب كميات 
أكبر من الكحول؟ وفي سياق هذه التجربة» هل هناك علاقة إيجابية بين نسبة 
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الكحول في الد ومعدلات الجاذبية المعطاة للصور؟ وإذا كان الأمر كذلك» 
فهل هذه العلاقة تختلف بين جنسي المشاركين أو بين الصور؟ 

بالرغم من أن البيانات تحتوي على 204 مشاهدات» فإنها Jis‏ ]5 
kju‏ فقطء gang‏ أنه من المعقول الاعتفاد بأن المشاركين ربما يختلفون في 
ميولهم لإعطاء معدلات أعلى أو أقل نوعاً ماء ويختلفون في ردة فعلهم تجاه 
الكحول. نموذج تأثيرات مختلطة مع تقاطعات عشوائية وقيم ميل يمكنه 
استيعاب هذه التعقيدات المحتملة. هذا الوضع يختلف عن مثال الانتخابات 
السابق في أن التقاطعات العشوائية الفردية وقيم الميل لن تكون مثيرة للاهتمام 
بدرجة كبيرة» LAY‏ تفسر أفرادًا مجهولين. Ld‏ هذه التجربة فهي عبارة عن 
بيانات أو ملامح تصميم تجريبي نحتاج لتعديله عند اختبار الفرضيات الرئيسة. 

باستخدام رموز المتغير العاملي؛ فإن الأمر xtmixed‏ أدناه يُحدد نموذجاً 
به متوسطات التقييم المعطاة لصور وجوه الإناث (ratefem)‏ ويتم التنبؤ ب 
بواسطة التأثير ات الثابتة للمتغير الإشاري «gender‏ والمتغير المستمر ac‏ 
وتفاعلهماء بالإضافة إلى ذلك» فإن النموذج يتضمن تقاطعات Atl pie‏ وقيم 
ميل للمتغير bac‏ والتي يمكن أن تختلف بين المشاركين. 


.xtmixed ratefem i.gender##c.bac || id: bac, 9 
Mixed-effects ML regression Number of obs = 204 
Group variable: id Number of groups = 51 
Obs per group: min = 4 
avg = 4.0 
max = 4 
Wald chi2(3) = 56.95 
Log likelihood = -170.9156 Prob > chi2 = 0.0000 










ratefem Coef. Std. Err. 2 P>|z| [95$ Conf. Interval] 

















-.6280836 .3203292 -1.96 0.050 -1.255917 -.0002499 
3.433733 .5231428 6.56 0.000 2.408392 4.459074 


l.cender 
bac 


gender#c.bac 
1 -1.154182 .9270306 -1.25 0.213 -2.971128 .6627648 


cons 6.442059 .1903235 33.85 0.000 6.069032 6.815086 
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eee‏ 















Random-effects Parameters Estimate Std. Err. {95% Conf. Interval 


id: Independent 









1.621421 «6564771 + 7332693 3.585323 
1.056773 - 1087889 . 8636849 1.293029 


sd(bac) 
sd(_cons) 








sd(Residual) - 3371602 .02408 .2931186 . 9 





LR test vs. linear regression: chi2 (2) = 279,98 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 


هذه النتائج لصور الإناث تدعم فرضية أكواب الجُعّة: فمعدلات الجاذبية 
لوجوه الإناث تزداد بزيادة نسبة الكحول في الدم» الجنس له تأثير لا يكاد أن 
يكون ملحوظاً: فالنساء أعطين معدلات JÍ‏ بقليل لوجوه النساءء تفاعل 
المتغيرين genderxbac‏ ليس ذا معنوية إحصائية. وعموماً فإن الميل العشوائي 
والتقاطع العشوائي للمتغير bac‏ شهد تبايناً ذا معنوية إحصائية» وتضمن 
اختلافات جوهرية من شخص لآخر في متوسط المعدلات المعطاةء وكيفية 
تأثير الكحول على هذه المعدلات. 

margins jY!‏ والأمر marginsplot‏ يساعدان في عرض هذه النتائج 
بيانيأء فمخرجات هذين الأمرين لم تعرض هناء ولكن سوف يتم دمجها مع 
التحليل التالي لتشكل الشكل (8.13). 


margins, at(bac- (0(.2).4) gender-(0 1)) vsquish 
emarginsplot, title("Female photos") ytitle("") 
xtitle("") noci 

legend(position(11) ring(0) row(2) 
title("Gender", Size(medsmall))) 

ylabel(4(1)8, grid gmin gmax) 

plotlopts (lpattern (solid) msymbol (T) ) 

plot2opts (lpattern (dash) msymbol(Oh)) saving 
(fig13_08RF) 


الأمر xtmixed‏ الثاني يقوم بصياغة نموذج لمعدلات صور الذكور 
*(ratemal)‏ 


-xtmixed ratemal i.gender##c.bac || id: bac, 
nolog 
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—————— بحب ببس ب بس هك 


Mixed-effects ML regression Nurber of obs = 201 
Group variable: id Number of groups = 51. 
‘bs per group: min = 3 

avg = 3:9 

max = 4 

Wald chi2 (3) = 32.74 

Log likelihood = -221.83425 Prob > chi2 = 0.0000 


ratemale Coef. Std. Err. z P>|z| [95$ Conf. Interval] 













1.gender 2.011293 -3742453 Saat 0.000 1.277196 2.744801 

bac .6401159 .7601351 0.84 0.400 -.8497215 2.129953 
gender#c.bac 

1 . 6055665 1.328251 0.46 0.648 -1.997758 3.208891 

_cons 3.946884 «2224468 17.74 0.000 3.510897 4.382872 










Random-effects Parameters 








Estimate Std. Err. (95% Conf. Interval] 





id: Independent 





sd(bac) 
sd(_cons) 


2.738856 .535468 1.867035 4.017777 
1.223205 .1284553 .9956575 1.502756 









sd (Residual) 






.4408696 .0278099 .389598 .4988886 


LR test vs. linear regression: chi2(2) = 255.98 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 


لا يبدو أن هناك تأثيرا لأكواب الجعة على كيفية تقييم صور الذكور. 
ومن ناحية أخرىء فإن الجنس كان له تأثير ثابت أقوىء أما تفاعل المتغيرين 
gender, bac‏ لم يكن ذا معنوية cA cas]‏ ولكننا مرة ة أخرى iu Cad y‏ ذا 


معنوية في الميل والتقاطع العشوئي. 
.margins, at(bac = (0(.2).4) gender = (0 1))‏ 
vsquish‏ 
.marginsplot, title("Male photos") ytitle("")‏ 
xtitle("") noci‏ 
legend(position(11) ring(0) row(2)‏ 
title("Gender", size(medsmall)))‏ 
ylabel(4(1)8, grid gmin gmax)‏ 
plotiopts(lpattern(solid) msymbol(T))‏ 
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eS eee‏ 


plot2opts(lpattern(dash) msymbol (Oh) ) 
saving (fig13_08RM) 


الشكل )8.13( يدمج الشكلين البيانيين marginsplot‏ وذلك للمقارنة 














المباشرة. 
-graph combine fig13_08RF.gph figi3 08RM.gph,‏ 
imargin(vsmall) 11("Mean attractiveness‏ 
rating")b2("Blood alcohol content "y‏ 
Female photos Male photos‏ 
s] Gender d Gender‏ 
Male —-^—— Male‏ هي 
Female —-9—- Female‏ -—6-— 
i‏ .2 
s 2e‏ 
^ 7 » 2 
ae E‏ 2 
$t efe-‏ 
g‏ 
1 
2 
c‏ 
of id‏ 8 
z‏ 
—À‏ 
4 2 0 4 3 0 0 
Blood alcoho! content‏ 
الشكل )8.13( 


الجانب الأيسر من الشكل )8.13( uay‏ التأثير الجوهري للكحول 
على تقييم صور الإناث. المشاركون من الذكور قاموا بإعطاء معدلات أعلى 
نوعاً ما وظهر بأنهم كانوا أكثر تأثراً بالكحول. الجانب الأيمن يصوّر وضعاً 
مختلفاً لتقييم صور الذكور. كما أن المشاركات الإناث قمن بإعطاء معدلات 
أعلى بشكل cla gabe‏ ولكن تقييم المشاركين من الذكور والإناث لم يتغير 
بصورة كبيرة كلما زاد تناول الكحول. 
السلاسل الزمنية المقطعية : Cross-Sectional Time Series‏ 
A pr GUY‏ العم E‏ سس 


هذا الجزء يقوم بتطبيق xtmixed jV!‏ على نوع مختلف من البيانات 
متعددة المستويات» وهو السلاسل الزمنية المقطعية:؛ ملف البيانات 
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Alaska regions.dta‏ يحتوي علي سلاسل زمنية للسكان في 7 قرية أو بلدية 
P‏ مناطق تعداد والتي تمثل les‏ ولاية آلاسکاء هذه 27 منطقة هي جزء من 
إطار لقاعدة بيانات سمات الإنسان لعموم القطب الشمالي تم شرحها بواسطة 
Hamilton and Lammers‏ )2011(« في بيانات الملف Alaska _regions. dia‏ هناك 
متغير وهمي اسمه large‏ يمثل أكثر خمس مناطق ازدحاماً بالسكان» والتني 
كان بها عدد السكان في سنة 2011 أكبر من 20,000« المناطق الأخرى 
ال 22 يغلب عليها الطابع الريفي وسكانها أقل وربما متوزعون على نطاق 
واسع. فمثلاً القرية بشمال غرب القطب الشمالي تغطي منطقة جغرافية أكبر 
من ولاية Maine‏ بالولايات المتحدة» ولكن عدد سكانها dil‏ من 8,000 نسمةء 
لكل منطقة من المناطق 7 هناك بيانات لعدد من السنوات تتراوح من سنة 
9 إلى 2011 ولكن مع وجود العديد من القيم المفقودةء ولذا فإنه لكل 
متغير هناك 27 نظيرًا ولكنه في العادة عبارة ye‏ سلاسل زمنية ناقصة. 
use C:\data\Alaska_regions.dta, clear‏ . 





-describe 
Contains data from C:\data\Alaska_regions.dta 
obs: 852 Alaska regions population 1969-2011 
vars: 7 2 Jul 2012 1 
size: 44,304 
ا‎ d يس‎ ii 
storage display value 
variable name type forat label variable label 
regionname str34 %34s Region name 
regioncode float %9.0g AON-SI region code 
year int $9.0g Year 
pop double $12.0g Population in thousands 
large byte %9.0g large Regions 2011 population » 20,000 
year0 byte $9.0g years since 1968 
year2 int $9.0g years0 squared 





Sorted by: regionname year 


خلال النصف الأول من الفترة الزمنية التي تغطيها البيانات» لوحظ أن 
عدد السكان ازداد بصورة كبيرة في العديد من المناطق الريفية في آلاسكا. 
وعموماً فإنه في السنوات الأخيرة فإن معدل النمو انخفض» وفي بعض 
المناطق انخفض عدد السكان. هذه الاتجاهات لها علاقة بالجدل الدائر حول 
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etui‏ ا 22275 
النمو الاقتصادي المستدام لهذه المناطق» وأيضا الأهمية الثقافية لسكان T‏ 
الأصلبين الذين يعيشون هناك. 
ولأن اتجاهات عدد السكان ببساطة لم تزدء فلا يمكننا صياغة Tisi‏ 
واقعي كدالة خطية للسنوات year‏ فالنموذج المختلط أدناه يمثل اتجاه عدد 
السكان كدالة تربيعية تقوم بحساب انحدار عدد السكان بالآلاف (pop)‏ على 
السنوات منذ (year0) 1968 Aus‏ وأيضا على تربيع yearÜ‏ » سوف نسمح 
للتقاطع الثابت )9( والعشوائي (U)‏ وقيم الميل لكلا الحدين» أكبر خمس مناطق 
مزدحمة بالسكان تم استبعادها في هذا التحليل حتى نركز على المناطق 
الريفية بآلاسكا. 
population; = By + Biyear0y + BayearO + uo; + u, year Dj;‏ عدد السكان 
uyyear0’y+ €, [7.13]‏ + 


. keep if large == 0 
-xtmixed pop year0 year2 ||  regionname: yearo 
year2 


Performing EM optimization: 

Performing gradient-based optimization: 
Iteration 0: log likelihood = -457.61229 
Iteration 1: log likelihood - -457.61196 


Iteration 2: log likelihood - -457.61196 


Computing standard errors: 


Mixed-effects ML regression Number of obs = 639 
Group variable: regionname Number of groups = 22 
Obs per group: min = 22 

avg = 29.0 

max = 40 

Wald chi2(2) = 1:22 

Log likelihood = -457.61196 Prob » chi2 = 0.5424 













Coef. Std. Err. 2 P»|z| [95% Conf. Interval 







year0 .0615239 -0783008 0.79 0.432 -.0919428 2149906 
year2 -.0008945 .0010787 -0.83 0.407 -.0030087 0012197 
.cons 5.457939 1.342116 4.07 0.000 2.82744 8.088438 
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امس لل ٠‏ سس سس ب LLL UR‏ 


Estimate Std. Err. [95$ Conf. Interval] 








Random-effects Parameters 








regionname: Independent 
sd(year0) 
sd(year2) 
sd(_cons) 





.3563579 .0619934 .2534009 .5011464 
.004861 .0008663 .0034278 .0068933 
6.145796 1.04392 4.405485 8.573587 










sd(Residual) .3524305 .0108473 .3317988 .3743451 
LR test vs. linear regression: chi2(3) = 2703.76 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 





كل التأثيرات العشوائية توضح تبايناً ذا معنوية إحصائية من مكان 
لآخر. ومن ناحية أخرىء فإن مُعاملات التأثير الثابت للمتغير 0«معبروالمتغير 
2 لا تختلف بدرجة كبيرة عن الصفرء مشيرة إلى النقص في وجود نمط 
عام ل 22 منطقة» الرسم البياني يتنبأ بعدد السكان (مع منحنى وسيط 
محدب) مع عدد السكان الفعلي cal y‏ وهذا يساعد في عرض تفاصيل 
التباين من منطقة M‏ 5« ويشرح عدم قدرة الأمر xtmixed‏ على إيجاد اتجاه 
عام (الشكل 9.13(« وفي بعض المناطق فإن axe‏ السكان زاد بثبات» بينما 
في مناطق أخرى فإن اتجاه النمو انخفض أو انعكس. النموذج يقوم بعمل جيد 
لتقليل بعض الفجوات الواضحة في البيانات he‏ استبعاد عدد السكان في 
جزراليوتائيس الغربية Aleutians West‏ التي شهدت Lalii‏ بعد تقليص 
المحطة الجوية البحرية في سنة 1994 أو الزيادة في المنحدر الشمالي North‏ 
مم التي حدثت بعد زيادة العاملين في المناطق البعيدة وكانت هذه الزيادة 
واضحة في تعداد سنة 2010. 


.predict yhat, fitted 

.graph twoway scatter pop year, msymbol (Oh) 
E mspline yhat year, l1width(medthick) 
bands (50) 

, by(regionname, note("") legend (off) ) 
ylabel(0(5)20, angle (horizontal) ) xtitle("") 
ytitle("Population in 1,000s") 
xlabel(1970(10)2010, grid) 
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ل a Eee‏ 
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الشكل )9.13( 


سوف تقوم بتحليل أكثر موضوعية» وذلك باستخدام انحدار التأثيرات 
المختلطة لصياغة نموذج للعلاقات يتضمن سلاسل زمنية متعددة يظهر في 
ورقة بحثية حول تعداد السكان والمناخ والكهرباء المستخدمة في مدن وقرى 
المنطقة القطبية الشمالية في Hamilton et aL) Kuy]‏ 2011( بيانات الملف 
Alaska places.dta‏ تحتو ي علي البيانات الأساسية لهذا التحليل» وتتضمن 
سلاسل زمنية سنوية لكل من 2 قرية ومدينة في المنطقة القطبية الشمالية 
endi à‏ ركلوا من aaa rap‏ الم أو القرى التي تم تمثيلها bio‏ 
في الشكل (9.13) أعلاه. المتغيرات تتضمن السكان وكيلووات ساعة 
ES‏ المباعة والمعدل المتوسط لتكلفة الكهرباء (التي كانت سائدة في سنة 
2009 بالدولار) وتقديرات درجات حرارة الصيف» ومعدل الهطول حول 
تلك المنطقة في كل سنة؛ الورقة تزودنا بمعلومات حول تعريفات المتغيرات» 
ومصادر البيانات؛ وشرح لهذا التحليل. 
.use C:\data\Alaska_places.dta, clear‏ 
describe‏ 
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a 


Contains data from C:\data\Alaska_places.dta 


obs: 742 Population, climate & electricity use in the Arctic 
(Hamilton 2011) 
vars: 12 2 Jul 2012 06:11 
size: 57,876 ` 
ببس‎ ————————— 
storage display value 
variable name type format label variable label 
ae پچ ی‎ LL ج جت‎ 
regionname str24 %24s Region name 
regioncode long  $9.0g AON-SI region code 
place str21 $21s Place name 
placecode byte — 9 placecode 
Place code (labeled) 
year int Sty Year 
pop int %12.09 Population--est. Jul 1/Census Apr 1 
logpop float $9.0g 10910 (pop) 
kwhsold20 float %9.0g kWh sold ajusted if 9-11 months, millions 
logkwhsold float %9.0g 10910 (kwhsold20) 
rateres09 float %9.0g av. res. rate 2009$ = rateres*cpianc09 
fsumtempD float 9 UDel FY summer (Ll1.Jul-Sep & May-Jun) temp 
fsumprecD float %9.0g UDel FY summer (L1.Jul-Sep & May-Jun) prec 


a 
٠ 


Sorted by: placecode year 


هذه البيانات تم اعتبارها بيانات طولية عن طريق الأمر tset‏ والذي 
قام بتحديد المتغير placecode‏ كمتغير طو لي» والسنة year‏ كمتغير زمني: 
.xtset placecode year‏ 
panel variable: placecode (unbalanced)‏ 


time variable: year, 1990 to 2008, but with gaps 
delta: 1 year 


تحليل التأثير المختلط أدناه يقوم بصياغة نموذج للكيلووات ساعة 
للكهرباء المباعة في كل حي وكل سنة كدالة لعدد السكان» ومعدل الكهرباء 
بالدولار وفقاً لسنة 2009 وحرارة الصيف والهطول والسنة. النموذج 
يتضمن تأثيرات عشوائية لكل من التعداد السكاني» وأخطاء الانحدار الذاتي 
من الدرجة الأولى. السبب وراء صياغة النموذج بهذا الشكل واختبارات ARM)‏ 
لنتائج النموذج تم عرضها في الورقة. الاختصار في العرض هنا يهدف إلى 
توضيح ما سوف يكون عليه مثل هذا النوع من التحليل. 


.xtmixed logkwhsold logpop rateres09 fsumtempD 
fsumprecD year 
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|| placecode: logpop, nocons residual(ar 1, 
t(year))nolog reml 


Note: time gaps exist in the estimation data 


Mixed-effects REML regression Number of obs = 742 

Group variable: placecode Number of groups = 42 

Obs per group: min = 12 

avg = iza 

max = 19 

Wald chi2(5) = 359.212 

Log restricted-likelihood - 1008.232 Prob » chi2 = 0.0000 
logkwhsold Coef. Std. Err. z P>|z| [95% Conf. Interval 
logpop . 7086409 .0716509 9.89 0.000 . 5682078 . 849074 
rateres09 -.0011494 .0005259 -2.19 0.029 -.0021801 -.0001187 
fsumtempD -.0038939 .0018784 -2.07 0.038 -.0075755 -.0002123 
fsumprecD .000272 .0001416 1.92 0.055 -5.57e-06 .0005495 
year .012952 .0010914 11.87 0.000 .0108129 .0150911 
_cons -27.51866 2.153197  -12.78 0.000 -31.73885 -23.29847 














Random-effects Parameters Estimate 





Std. Err. [95% Conf. Interval] 





placecode: Identity 


sd(logpop) - 0989276 + 0132542 .0760807 .1286354 














Residual: AR(1) 







. 7900083 .0394952 .699089 .8557882 
.0857878 .0076267 .0720696 .1021173 


rho 





LR test vs. linear regression: chi2(2) = 1506.36 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 


النموذج هو: 
log(kwhres;) = -27.52 + 0.7086 llogio(popi,) — 0.0011rateres09,, - 0.003 9fsumtepi,‏ 

0.0003fsumprec;, + 0.1302 + pjlogio(popy) + 0.79000;,4 + ti [13.8]‏ + 
استخدام الكهرباء في قُرى المنطقة القطبية الشمالية تم التنبؤ به بواسطة 
عدد السكان» والسعر»ء ودرجة حرارة الصيف. وعلى عكس الوضع في 
المناطق الجنوبية» Cus‏ يكون فصل الصيف حارا والذي يعني استخداما أكثر 
el asl‏ يسبب المكيفات» فاته إذا كان cipue‏ النقاطق القظبية الشمالية حار 
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(وفي العادة أقل مطراً) فقد يؤدي ذلك إلى تشجيع الناس إلى قضاء أوقات أكبر 
خارج بيوتهم» وبتعديل النموذج au‏ في الاعتبار تأثيرات عدد السكان 
والسعر والجوء فإننا نرى نمطاً تصاعدياً Lle‏ في استخدام الكهرباءء OY‏ 
الحياة تصبح أكثر تطلباً للكهرباء. وأخيراً فإن التباين الكبير في الميل العشوائي 
لعدد السكان يشير إلى أن تأثيرات كل شخص تختلف من مكان c JAY‏ وهذه 
التأثيرات تميل لتكون أكبر في المناطق الشمالية ومجتمعات da‏ المنحدر 
الشمالية» وحد الخطأ للانحدار الذاتي AR)‏ يظهز nd.‏ ذو معلوية Alas]‏ 
وكما لاحظنا في الفصل (12) فإن السلاسل الزمنية عادة يتم اختبار 
اسنقر ار ها stationarity‏ قبل صياغة النموذج» وذلك لتجنب الحصول على 
نتائج مضللةء الفروقات تعتبر إحدى الأدوات المفيدة للقيام بذلك. Yay‏ من 
ذلك» فإنه حتى lane‏ كو السلاسل الزمنية غير مستقرة - كما في هذا 
المثال (أو كما في نماذج ARMAX‏ في الفصل 12( - فإنه يمكننا البحث عن 
مزيج خطي من المتغيرات المستقرة (لمزيد من المعلومات عن التكامل 
المشترك cointegration‏ انظر كتاب Hamilton‏ 1994( النموذج [8.13] يمكنه 
القيام بهذه المهمة بكفاءة عالية» كل 42 سلسلة المتبقية (سلسلة واحدة لكل 
مجتمع) والتي تم إنشاؤها بواسطة هذا النموذج لم seb‏ أي منها ارتباطا 
ذاتيا ذا معنوية إحصائية في اختبار إحصائيات © الصندوقية. ولذلك فإن 
البواقي لا يمكن تمييزها عن pi‏ الضجيج الأبيض» وقيم عملية التغاير 
الثابت. الأوامر أدناه تقوم بحساب القيم dn gna‏ أكذة قلسي || لادان جيه 
الانحدار الذاتي Ghat xr)‏ ثم يتم استخدام هذه التوقعات لحساب البو اقي 
om od‏ اختبارات © للضجيج الأبيض (wntestq)‏ لا تعرض انحدارًا ذاتياً 
متبقيا. والمخرجات أدناه هي لأول 3 من 2 dais‏ 


.predict yhat xt, fitted 

.generate resid xt - logkwhsold - yhat xt 

.replace yhat_xt= yhat xt «(.7900077*L1.resid xt) 
.gen yhat xti0 = 10^yhat xt 

.replace resid xt = logkwhsold - yhat xt 

.label variable yhat xt "predicted values 
log(million kWh)" 

.label variable yhat xt10 "predicted values in 
millions of kWh" 
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.label variable resid xt "residuals log(million 
kWh)" 

.mitestg resid xt if place == "Ambler city", 
lags(5) 


Portmanteau test for white noise 


Portmanteau (Q) statistic - 4.3048 
Prob » chi2(5) - 0.5064 
.wntestq resid xt if place == "Anaktuvuk Pass 


city", lags(5) 


Portmanteau test for white noise 


Portmanteau (Q) statistic - 2.3503 
Prob » chi2(5) = 0.7989 
.wntestq resid_xt if place == "Aniak city", 


lags (5) 


Portmanteau test for white noise 


Portmanteau (Q) statistic = 5.6826 
Prob > chi2(5) = 0.3383 


اختبارات مشابهة لكل 42 مجتمعاً وجدث بأن جميع سلاسل البواقي ليس 
لها ارتباط ذاتي ذو معنوية. 
الاحدار اللوغاريتمي ذو الثاثيرات المخطخلطة : 


Mixed-Effects Logit Regression 





منذ Axa‏ 1972 يحاول الاستطلاع الاجتماعي العام Davis et al.)‏ 2005( 
بمتابعة الرأي العام الأمريكي من خلال سلاسل استطلاع سنوية أو نصف 
سنوية. وهذه البيانات متوافرة للتدريس والبحث» ملف البيانات 
GSS. 2010 SwS‏ يحتوي على عينة فرعية صغيرة لمتغيرات ومشاهدات من 
استطلاع Aiu‏ 2010 وهي تتضمن متغيرات إضافية مع إجابات عن أسئلة 
حول التصويت والمخدرات والرقابة على السلاح والتغير المناخي والتطور؛ 
موقع الاستطلاع الاجتماعي GSSalell‏ على الإنترنت يوفر معلومات مفصلة 
عن مصدر هذه البيانات -(http://www3.norc.org/GSS* Website)‏ 
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.use C;\data\GSS_2010_SwS.dta, clear 





.describe 
Contains data from C:\data\GSS_2010_SwS.dta 
obs: 809 General Social Survey 2010--evolution etc. 
vars: 19 2 Jul 2012 06:11 
size: 21,843 
ر‎ 
storage display value 
variable name type format label variable label 
id int &8.0g Respondent ID number 
year int &88.0g GSS year 
wtssall float 59.09 LABCM probability weight 
cendiv byte — $15.0g cendiv Census division 
logsize float %9.0g log10(size place in 1,000s, +1) 
age byte %8.0g age Age in years 
nonwhite byte — $9.0g nonwhite Consider self white/nonwhite 
sex byte $8.0g sex Respondent gender 
educ byte %8.0g educ Highest year of schooling 
married byte %9.0g yesno Currently married 
income06 byte %15.0g income Total family income 
polviews byte %12.0g polviews Polit views liberal-conservative 
bush byte %9.0g yesno Voted for Bush in 2004 
obama byte %9.0g yesno Voted for Obama in 2004 
postlife byte %8.0g yesno Believe in life after death 
grass byte %9.0g grass Should marijuana be legalized? 
gunlaw byte %9.0g gunlaw Oppose permit required to buy gun 
sealevel byte %10.0g sealevel Bothered if sea level rose 20 ft 
evolve byte %9.0g true Humans developed/ earlier species 
Sorted by: id 


سؤال GSS‏ حول التطور سوف يكون المحور الأساسي لهذا التحليل. هذا 
السؤال يحتوي على جزء من القدرة على القراءة والكتابة والعلوم ويسأل عما 
إذا كانت العبارة أدناه صحيحة أو خاطئة. 
البشر - كما نعرفهم اليوم - تطوّروا من Ys‏ سابقة من الحيوانات . 
هذا السؤال يستند إلى اعتقادات فرديةء بالإضافة إلى معرفة KA gale‏ 
حوالي 9655 من المشاركين قالوا إن هذه العبارة صحيحة. 
.tab evolve‏ 


Humans 
developed/ 
earlier 
Species Freq. Percent Cum. 





الفصل الثالث عشر : صياغة نماذج التأثيرات المختلطة والمستويات المتعددة 641 





لا توجد قيم مفقودة للمتغير evolve.‏ ولا يوجد معيار تم وضعه لاختيار 
هذا الجزء الفرعي من البيانات والذي يمثل 809 مشاركين في استطلاع 
5» الإجابات التي تقول بأن العبارة "خاطئة" “False”‏ في المتغير evolve‏ تم 
ترميزها بالرقم 0 والعبارة "صحيحة" “True”‏ 1 السؤال حول الاستطلاع 
المرجح يُعتبر مسألة معقدة مع النماذج متعددة المستويات. وهذه المسألة لم 
يتم حلها بعد في أمر ستاتا xtmelogit‏ ولن يتم تناولها هنا. 

وفي العادةء فإن البحوث تجد أن زيادة القدرة على القراءة والكتابة 
والعلوم تزداد مع التعليم» وأيضاً تتعلق بعوامل أخرى تتعلق بخلفية الشخص؛ 
وفي Alla.‏ المتغير evolve‏ فإننا نتوقع أن هذا المتغير له علاقة ما مع التوقعات 
السياسية أيضاًء فالانحدار اللوغاريتمي البسيط يؤكد مثل هذه الفرضيات» 
حيث إن النتائج تُشير إلى أن الذكور ذوي المستوى التعليمي وذوي وجهات 
سياسية معتدلة في الغالب يعتقدون بتطور الإنسان من سلالات حيوانية 


ناق 

.logit evolve sex age educ polviews, nolog 
Logistic regression Number of obs  - 785 
LR chi2(4) = 98.93 
Prob > chi2 = 0.0000 
Log likelihood = -489.36806 Pseudo R2 = 0.0918 






















evolve Coef. Std. Err. 2 P»|z| [95$ Conf. Interval] 








sex -.6089296 .1565972 -3.89 0.000 -.9158545 — -.3020047 

age -.008189 .0045313 -1.81 0.071 -.0170701 . 0006922 

educ .0990929 .0254359 3.90 0.000 .0492395 .1489463 
polviews -.4482161 .0575731 -7.79 0.000 -.5610573  -.3353749 
_cons 1.457699 .4891102 2.98 0.003 -4990611 2.416338 





وبغض النظر عن مثل هذه المتغيرات التنبؤية على المستوى الفردي 
بخصوص الاعتقاد حول التطور البشري» فإنه قد تكون هناك مكونات على 
مستوى المناطق أيضاًء الخلافات حول تدريس التطور البشري في المدارس 
كان السمة البارزة في الجنوب. واتساقاً مع هذا الانطباع؛ فإن اختبار كاي 
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تربيع لبيانات GSS‏ يوضح فروقات ذات معنوية إحصائية بين تقسيمات تعداد 
السكان GLY ly‏ المتحدة» قبول الفرضية مرتفع lap‏ )9689( بين المشاركين 
في الدراسة من نيوإنجلاند „ag New England‏ الولايات Maine,‏ 
«Massachusetts, New Hampshire, Rhode Island, Vermont‏ و هذه النسبة تكون 
عند JÍ‏ قيمة لها )2636( بين تقسيم السكان للمناطق الوسطى الجنوبية 
الشرقية E South Central‏ وي الولايات Alabama, Kentucky, Mississipi,‏ 
66 تقسيمات السكان في مناطق المحيط الهادئ Pacific‏ والمناطق 
الوسطى الجنوبية الغربية W South Central‏ و هي ثاني أعلى وثاني dil‏ قيم 
على التوالي. 


.tab cendiv evolve, row nof 2 






Humans developed/ 
earlier species 
False 




















Census division True Total 


New England 


Middle Atlantic 100.00 
E North Central 100.00 
W North Central 100.00 
South Atlantic 100.00 
E South Central 100.00 
W South Central 100.00 
Mountain 100.00 


Pacific 








55.50 100.00 


Pearson chi2(8) = 48.6890 Pr = 0.000 


يمكننا إضافة تقسيم تعداد سكان لتحليل الانحدار كمجموعة مثغيرات 
إشارية للتقسيمات من 2 وحتى 9 كل منها يتناقض مع تقسيم السكان 1 
الخاص بنيو انجلاند «New England‏ 


.logit evolve sex age educ polviews i.cendiv, 
nolog 
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اكاك ee ee cvi.‏ 


Logistic regression Number of obs = 785 
LR chi2 (12) = 124.92 
Prob > chi2 = 0.0000 
Log likelihood = -476.37206 Pseudo R2 = 0.1159 





evolve Coef. Std. Err. 2 P>|z| (95% Conf. Interval 
sex -.5609946 .160387 -3.50 0.000 -.8753473  -.2466419 
age -.0092908  .0046327 -2.01 0.045 -.0183706  -.0002109 
educ .0842967 .0261043 3.23 0.001 .0331333 .1354601 
polviews -.416007 2227 -7.03 0.000 -.532001 -.3000131 
cendiv 

2 -1.501592 .6612973 -2.27 0.023 -2.797711 . -.2054736 

3 -1.602085 .6504787 -2.46 0.014 -2.877 | -.3271704 

4 -1.505793 . 9 -2.17 0 -2.864361 -.1472243 

5 -1.843963 , 49 -2.86 0,004 -3.106734 -,5811918 

6 -2.149803 .6973044 -3.08 0.002 -3.516495  -.7831115 

J -2.239585 -6743959 -3.32 0.001 -3.561376 | -.9177932 

8 -1.454279  .6854426 -2.12 0.034 -2.797722  -.1108363 

9 -1.141026  .6642829 -1.72 0.086 -2.442996 .1609447 
cons 3.179554 .8138406 3.91 0.000 1.584455 4.774652 





المُعاملات الخاص بالمتغيرات الإشارية لتقسيم ما تعطي تغييرًا في 
التقاطع حر لذلك التقسيم بالمقارنة مع ني وإنجلاند» كل هذه المُعاملات سالبةء 
لأن الاحتمالات اللوغاريتمية لقبول الاعتقاد بالتطور "T.‏ أقل في 
تقسيمات السكان الأخرى عنه في نيوإنجلاند. وكما هو cad sie‏ فإن الفرق 
كبير fag‏ للتقسيم 6 الذي يمثل المنطقة الوسطى الجنوبية الشرقية E South‏ 
«Central‏ أما التقسيم 9 الذي يمثل منطقة المحيط الهادئ Pacific‏ هو الوحيد 
الذي لا يختلف كثيراً واختلافه ليس ذا معنوية عن نيوإنجلاند» صافي هذه 
التأثيرات على مستوى المناطق وكل المتغيرات التنبؤية على المستوى 
الفردي أظهرت تأثيرات GIS‏ معنوية في الاتجاهات المتوقعة. 
طريقة المتغير الإشاري تعمل بشكل جيد هناء وذلك لأن لدينا 9 
مجموعات فقط (تقسيمات سكان)؛ وهذه التقسيمات تختبر فرضيات بسيطة 
حول حركة التقاطعات c7‏ وعند وجود مجموعات ASÍ‏ أو فرضيات معقدة 
فإن طريقة التأثيرات المختلطة يمكن أن تكون أكثر عملية» فمثلاً قد نقوم 
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بإدخال تقاطعات عشوائية لكل تقسيم في التعداد السكاني في نموذج انحدار 
لوغاريتمي ذي تأثيرات مختلطة LS‏ سيتم لاحقاء تركيبة الأمر xtmelogit‏ 
تتشابه مع تلك الخاصة بالأمر .xtmixed‏ 


.xtmelogit evolve sex age educ polviews || 
cendiv: , nolog 


Mixed-effects logistic regression Number of obs = 785 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 27 

avg = 87.2 

max - 181 

Integration points - 7 Wald chi2 (4) = 72.41 
Log likelihood = -487.10546 Prob > chi2 = 0.0000 










evolve Coef. Std. Err. z P>|z| {95% Conf. Interval] 








sex -.5794058 .1591076 0. -.8912511 -.2675606 

age -.0086106 .0045962 -1.87 0.061 -.0176191 .0003979 

educ .0910441 .0259804 3.50 0.000 .0401235 .1419647 
polviews -.4300722 .0588037 -7.31 0.000 - 4 -.3148191 
_cons 1.541323 .5135582 3.00 0.003 5347679 2.547879 

















Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 














cendiv: Identity 


sd( cons) .3375876 .1559346 .1365241 .8347641 






LR test vs. logistic regression: chibar2(01) - 4.53 Prob>=chibar2 = 0.0167 


التقاطعات العشوائية في المخرجات أعلاه توضح تبايناً ذا معنوية» وهذا 
ما يوضحه اختبار معدل الأرجحية العظمى مع الانحدار اللوغاريتمي العادي 
(p = 0.0167)‏ أو من خلال الانحراف المعياري للتقاطعات العشوائية 
)0.3376(« حيث إنه أكبر من ضعف خطأه المعياري )0.1559(« الأوامر 
التالية تقوم بتقدير قيم لهذه التقاطعات العشوائية من خلال الأمر e— predict‏ 
إنشاء جدول يعرض هذه القيم بواسطة المتغير ccondiv‏ وبالاتساق مع 
تحليلات كاي تربيع السابقة» وتحليلات المتغيرات الإشارية السابقةء فإننا 
نرى تقاطعات y=‏ عشوائية موجبة (مؤدياً إلى زيادة التأثير الكلي) لتقسيمات 
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السكان في ني وإنجلاند والمحيط الهادئ» ولكن هناك تقاطعات y-‏ عشوائية 
سالبة Loge)‏ إلى انخفاض التأثير الكلي) لتقسيمات السكان بالمنطقة الوسطى 
الجنوبية الشرقية والمنطقة الوسطى الجنوبية الغربية. 

.predict recendiv, reffects 
.label variable recendiv "random-effect 


intercept cendiv" 
¿table cendiv, contents (mean recendiv) ~ 











Census division | mean(recendiv) 





New England 













.4649539 


Middle Atlantic .0523787 

E North Central -.0165851 

W North Central .0429461 

Mi South Atlantic -.2134227 
E South Central -.3085577 

W South Central -.4224425 

Mountain .083739 


Pacific 





.3052153 


ولذا ated‏ استخدام أي طريقة سوف نجد نمطا موثوقاً للاختلافات 
الإقليمية حول الاعتقاد بتطور الإنسان» حتى بعد التحكم في العوامل الفردية. 
فنماذج التأثيرات المختلطة تسمح لنا بالتقدم أكثر من خلال اختبار أفكار أكثر 
تفصيلا حول الاختلافات الإقليمية. 


بعض الدراسات حددت التعليم كمؤثر أساسي في الاعتقاد بتطور 
الإنسان» وبعض الاعتقادات العلمية الأخرى» والسؤال الآن هو: هل تأثيرات 
التعليم تختلف من تقسيم سكاني لآخر؟ يمكننا اختبار ذلك بواسطة إضافة قيم 
ميل وتقاطعات عشوائية معا: 


.xtmelogit evolve sex age educ polviews E 
cendiv: educ, nolog 
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Mixed-effects logistic regression Number of obs = 785 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 27 

avg - 87.2 

max - 181 

Integration points - 7 Wald chi2(4) z 71.63 
Log likelihood - -486.57368 Prob » chi2 = 0.0000 
evolve Coef. Std. Err. 2 P»|z| [95$ Conf. Interval] 













sex -.5692675 .1595327 357 0.000 -.8819458 -.2565893 

age -.0090823 .0046088 -1:97 0.049 -.0181153 -.0000492 

educ .0924205 .027522 3.36 0.001 .0384784 .1463627 
polviews -.4290164 .0588184 -7.29 0.000 -.5442984  -.3137343 
-cons 1.532699 .4979934 3.08 0.002 +55665 2.508748 

















Random-effects Parameters Estimate {95% Conf. Interval] 









cendiv: Independent 
- 0268375 0115911 .0115109 .0625712 
5.23e-07 .4785104 0 


sd (educ) 
sd( cons) 






LR test vs. logistic regression: chi2(2) = 5.59 Prob » chi2 - 0.0612 


Note: LR test is conservative and provided only for reference. 


الانحراف المعياري لقيم الميل العشوائي للتعليم AÍ‏ من ضعف الخطأ 
المعياري» وهذا يشير إلى أن التباين الإقليمي ذو معنوية إحصائية» ومن 
ناحية «s à]‏ فإن الانحراف المعياري للتقاطعات العشوائية يقتترب من 
الصفرء وهذا يعني عدم وجود تباين من مكان AY‏ قد يتم استخدام نموذج 
أبسط يقوم بإهمال التقاطعات العشوائية من خلال الخيار nocons‏ الذي يعطي 
أرجحية لوغاريتمية متطابقة. 


.xtmelogit evolve sex age educ polviews 
|| cendiv: educ, nolog nocons 
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Mixed-effects logistic regression Number of obs = 785 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 27 

avg = 87.2 

max = 181 

Integration points = 7 Wald chi2(4) = 71.63 
Log likelihood = -486.57368 Prob > chi2 = 0.0000 









evolve 







Coef. Std. Err. [95$ Conf. Interval] 









sex -.5692676 .1595327 -.8819459  -.2565893 

age -.0090823 .0046088 -1.97 0.049 -.0181153  -.0000492 

educ .0924205 .027522 3.36 0.001 .0384784 .1463626 
polviews -.4290164 .0588184 -7.29 0.000 -.5442984  -.3137343 
_cons 1.532699 + 4979933 3.08 0.002 .55665 2.508748 



















Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 






cendiv: Identity 





sd(educ) .0268374 .011591 .0115108 











.062571 





LR test vs. logistic regression: chibar2(01) - 5.59 Prob»-chibar2 - 0.0090 


نموذج الميل العشوائي المبسط odef‏ يقوم على افتراض أن التعليم له 

تأثيرات مختلفة على الاعتقاد بتطور الإنسان في ol jal‏ مختلفة من AN gall‏ 

ولمعرفة ماهي هذه التأثيرات» يمكننا توقع predict‏ قيم الميل العشوائي» 

وإنشاء متغير جديد «'aneduc aul‏ التأثيرات الكلية للمتغير educ‏ تساوي هذه 

التأثيرات العشوائية زائد التأثير الثابت لمعامل b[educ]‏ « ثابت "المتغير" 

المُسمى fixed‏ يتم إنشاؤه لعرض التأثيرات الثابتة في جدول ومتغير جديد 

يُسمى roreduc‏ يعرض التأثيرات الكلية للتعليم أو الميل على educ‏ لكل تقسيم 
سكاني. 

.predict raneduc, reffects 

.label variable raneduc "random-effect slope 

educ" 
.gen toteduc = raneduc +  b[educ] 
.label variable toteduc "total random + fixed- 


effect slope educ" 
.gen fixeduc =  b[educ] 
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.label variable  fixeduc "fixed-effect slope 
educ (constant)" 

.table cendiv, contents(mean  fixeduc mean 
raneduc mean toteduc) 











Census division meanifixeduc)  mean(raneduc)  mean(toteduc) 















-0924205 .. 7 .1313663 
.0924205 .0089432 .1013638 


New England 
Middle Atlantic 


E North Central .0924205 -.0036121 .0888085 
W North Central .0924205 iï .0035191 .0959396 
South Atlantic .0924205 -.0148976 .077523 
E South Central .0924205 -.0239878 . 0684328 
W South Central .0924205 -.0366144 .0558061 
Mountain .0924205 .0033255 .095746 
Pacific .0924205 .0227141 5 .1151346 








من الجدول يمكننا التأكيد بأن التأثير الكلي للتعليم يساوي التأثيرات 
الثابتة زائداً التأثيرات العشوائيةء الشكل )10.13( يعرض هذه التأثيرات 
الكلية.. l ٠‏ 

.graph hbar (mean) toteduc, over (cendiv) 


ytitle("Effect of education on log odds 
believe evolution") 


New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 

E South Central 
W South Ceniral 
Mountain 


Pacific 





r “TT 
0 .05 if 15 
Effect of education on log odds believe evolution 


الشكل )10.13( 
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نرى أن التعليم له تأثير موجب على الاحتمالات اللوغاريتمية لقبول 
فرضية تطور الإنسان في كل تقسيمات السكان» تأثيرات التعليم أكبر قوة بين 
المشاركين: من ولايات نيوإنجلاند والمحيط الهادئ» مقارنة مع المناطق 
الوسطى Asi‏ الغربية والشرقية. 


y \ ea)‏ بوكر 
مقدمة في البرمجة 
Introduction to Programming‏ 








كما رأينا سابقاً» فإنه يمكننا إنشاء نوع بسيط من البرامج بواسطة كتابة 
أي سلسلة من 4 54 ستاتا في ملف نصتي (ASCI)‏ أو بمحرر الملف 
التنفيذي Do-file Editor‏ ببرنامج ستاتا (يمكنك الوصول إليه بالنقر على القائمة 
Window > Do-file Editor‏ أو النقر على أيقونة E‏ ( يعتبر طريقة سهلة 
للقيام بذلك. بعد حفظ ملف do-file‏ سوف نقوم بإدخال «Stata‏ ونطبع od‏ في 
شكل do filename‏ فهذا يُخبر ستاتا بقراءة الملف المسمى filename.do‏ وتنفيذ 
كل الأوامر التي يحتويها هذا الملف. كما يمكن إجراء عمليات برمجة أكثر 

تعقيداً باستخدام لغة برمجة مدمجة ببرنامج ستاتا نفسه. أغلب yal gf‏ ستاتا 
التي تم استخدامها في فى الفصول السابقة» تتضمن برامج تم كتابتها في برامج 
Gls‏ هذه البرامج قد تم إنشاؤها أصلاً بواسطة شركة ستتا أو من 
مستخدمين يحتاجون أشياء لا يمكن للغة برمجة ستاتا القيام بها أو أنهم 
يحتاجونها لمهام معينة 


dag Mig ta gal‏ إلى كل daa c pe‏ عبت ان هة 
البرامج تتصل ببرامج أخرى؛ وهذه الأخيرة تتصل ببرامج أخرى» وتستخدم 
أدوات مساعدة لصياغة النماذج. وهذه الأدوات تتضمن جبر المصفوفات» 
وتقدير الأرجحية العظمى» » القدرة على كتابة برامج ستاتا agi‏ ما يمكننا 
القيام به حتى ولوكان هدفنا واسعاً fas‏ مثل إضافة أساليب إحصائية جديدة أو 
هدف بسيط مثل إدارة قاعدة بيانات معينة. 
البرمجة موضوع واسع في ستاتاء وهذا الفصل المختصر يعرض مقدمة 
لبعض المفاهيم والأدوات الرئيسة مع بعض الأمثلة عن كيفية استخدامها لتسهيل 
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مهام تحليل البيانات. إذا كنت مهتماً بتعلم تفاصيل fst‏ فيمكنك الاطلاع على 
الدروس الموجودة gä gas‏ ستاتا (www.stata.com/netcourse)‏ فهي المكان المناسب 
كبداية» Ul‏ المرجع الرئيس حول البرمجة فهو دليل المستخدم للبرمجة 
(ye Y Programming Reference Manual‏ من Mata Matrix Programming US‏ 
Manual‏ هناك تفاصيل عن تقدير الأرجحية العظمى والبرمجة في كتاب 
(Gould, Pitblado and Poi 2010) Maximum Likelihood Estimation with Stata‏ 


Basic Concepts and Tools : أدوات ومفاهيم أسأسية‎ 


بعض الأدوات d relia‏ تدمج مع قدرات gal y)‏ ستاتا = تم 
شرحها في فصول سابقة - تعتبر كافية ASUS‏ 
Do-files‏ 
الملفات التنفيذية do-files‏ هي ملفات نصية من نوع (ASCII‏ تم إنشاؤها 
بواسطة محرر الملفات التنفيذية بيرنامج ستاتا Do-file Editor‏ أو محرر 
نصوص أو أي برنامج تحرير نصي آخر. وهذه الملفات يتم حفظها بامتداد 
do‏ الملف يمكن أن يحتوي على أي سلسلة من أوامر ستاتا المنطقية. وفي 
ستاتا طباعة الأمر أدناه تقود برنامج ستاتا إلى قراءة الملف filename.do‏ 
وتنفيذ الأوامر التي يحتويها هذا الملف: 
.do filename‏ 
كل أمر في الملف filename.do‏ بما فيه آخر أمرء يجب أن ينتهي بنهاية 
السطر ليبدأ من بداية سطر جديد مالم نضع bane‏ من خلال الأمر #delimit‏ 
#delimit ;‏ 
هذا يضع فاصلة منقوطة كمحدد في نهاية السطر؛ وبذلك فإن برتامج 
ستاتا يعتبر أن السطر قد انتهى حتى sled‏ الفاصلة المنقوطة؛ وضع 
الفاصلة المنقوطة كمحدد يسمح للأمر الواحد بأن يمتد لأكثر من سطر واحدء 
لاحقاً يمكننا ضغط مفتاح "إدخال" في لوحة المفاتيح كنهاية معتادة مع أمر 
#delimit‏ آخر: 


#delimit cr 
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ملاحظة مطبعية: العديد من الأوامر التي تظهر في هذا dail‏ على 
الأرجح يتم طباعتها Jala‏ ملف You do-file‏ من طباعتها كأمر قائم بذاته في 
نافذة الأوامر» حيث تتم كتابة هذه الأوامر ضمن أوامر البرامج بدون عرض 
alas‏ قبلها >« كما تم في المثالين السابقين Hdelimit Mel‏ (ولكن ليس مع 
الأمر do filename‏ والذي يجب كتابته في نافذة الأوامر كمأ هو معتاد). 
Ado-files‏ 
ملفات Ado-files‏ (التنفيذ الآلي) هي عبارة عن ملفات ASCII‏ تحتوي 
على سلسلة من أوامر ستاتا مثل ملف cdo-files‏ الاختلاف بينها وبين ملفات 
do-file‏ هو Lal‏ لا نحتاج إلى طباعة الأمر is do filename‏ نشغل الملف 
cado-file‏ بافتراض Lf‏ قمنا بطباعة الأمر 
.Clear‏ 
كما هو الوضع مع أي أمرء فإن ستاتا يقوم بقراءة ذلك الأمرء وفحص 
ما إذا كان هناك أمر فعلي موجود بهذا الاسم. إذا كان الأمر clear‏ غير 
موجود كجزء من أوامر ستاتا التنفيذية (وفي الحقيقة أنه موجود) فإن ستاتا 
سوف يبحث عن الأمر في قاموسه العادي وهو stan “ado”‏ إيجاد ملف 
باسم celearado‏ إذا وجد ستاتا الملف LS)‏ يُقترض) فإنه يقوم بتنفيذ الأوامر 
التي يحتويها هذا الملف. 
ملفات 200-5165 لها امتداد ado‏ والبرامج المكتوبة بواسطة المستخدمين 
(التي كتبتها أنت كمستخدم) في العادة يتم حفظها في مجلد باسم 
C:\ado\personal‏ والبرامج المكتوبة بواسطة مستخدمي ستاتا الآخرين يتم 
حفظها في العادة في المجلد C:\ado\plus‏ ومئات ملفات 200-8165 الرسمية يتم 
تثبيتها في المجلد «C:\Program Files\Stata\ado‏ قم بطباعة sysdir‏ لمشاهدة 
قائمة بالمجلدات المستخدمة من قبل برنامج ستاتا الحاليء وقم بطباعة الأمر 
help sysdir‏ أو help adopath‏ لمعرفة كيفية تعديلها. 
الأمر which‏ يوضح ما إذا كان Ioa‏ معيناً هو في الواقع أمر من أوامر 
ستاتا أو أمر موجود في ملف cado-file‏ وإذا كان الأمر هو أمر 200-516 
فيحدد Stud cule‏ الأمر summarize‏ من ضمن الأوامر المدمجة؛ ولكن 
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الأمر regress‏ حالياً مق مق الو امر المعرفة بملف s ado-file‏ الذي يُسمى 
00 و الذي تم تحديثه في dod‏ 2011. 


-which summarize 
built-in command: summarize 


ewhich regress 
C:\Program Files\Stata\ado\base\r\regress.ado 
l*version 1.3.0 1 


هذه التفرقة لا تمثل أي شيء لأغلب المستخدمين» لأن الأمر summarize‏ 
والأمر 58 يعملان بنفس السهولة عند اس تخدامهما. ودراسة الأمثلة 
واستعارة رمز من آلاف من ملفات 200-515 ببرنامج ستاتا يمكن أن تساعدك 
عند البداية في AGS‏ برنامج cle‏ مخرجات الأمر which‏ أعلاه تعطي موقع 
ملف regress.ado‏ ولمشاهدة الرموز الفعلية في هذا الملف قم بطباعة الأمر 

.viewsource regress.ado 

ملفات C3 5 ado-files‏ أوامر التقدير ببرنامج ستاتاء وهذه الملفات 
تطورت بشكل ملحوظء وأصبحت أكثر تعقيداً خلال السنوات الأخيرة Cus‏ 
إنها استوعبت قدرات جديدة ببرنامج ستاتا مثل svy:‏ 
البرام؟ : Programs‏ 


ملفات do-files‏ وملفات ado-files‏ قد يتم اعتبارها أنواعاً من البرامج. 
ولكن برنامج Ga‏ يستخدم كلمة 'برنامج" بمعناها الضيق لتعني سلسلة من 
الأوامر يتم حفظها في الذاكرء وتنفيذها من خلال طباعة اسم برنامج معين؛ 
ملفات do-files‏ أو ado-files‏ أو الأوامر تطبع بشكل تفاعلي لتعريف مثل هذه 
البرامج» التعريف يبدأ مع عبارة تحدد اسم البرنامج؛ فمثلا لإنشاء برنامج 
counts aul‏ نبدأ بطباعة 

Program count5 

الأسطر التالية يُقترض أن تحدد بشكل فعلي البرامج» وأخيراً نعطي od‏ 

إنهاء end‏ نتبعه بالضغط على مفتاح الإدخال. 


end 
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عندما يقرأ ستاتا أوامر تعريف البرنامج» فإنه يحفظ تعريف البرنامج في 
الذاكرة ويبدأ في تشغيله في أي وقت نطبع فيه اسم البرنامج كأمر: 
.count5‏ 
البرامج ast‏ بكفاءة بإنشاء أوامر جديدة متوافرة ببرنامج Gia‏ ولذا فإن 
أغلب المستخدمين لا يحتاجون إلى معرفة ما 13 كان أي PP.‏ من 
برنامج ستاتا نفسه أو من برنامج -ado-file‏ 
Qai‏ في 3a‏ البدء بكثابة برنامج cane‏ فإننا عادة نقوم بإنشاء 
إصدارات أولية ناقصة أو غير مكتملة» الأمر program drop‏ مفيد ويسمح 
Ll‏ بمسح برامج من الذاكرة حتى يمكننا تعريف إصدار جديدء فمثلا Cu)‏ 
برنامج count5‏ من الذاكرة نقوم بطباعة الأمر 
program drop count5‏ 
لمسح كل البرامج (بدون مسح البيانات) من الذاكرة قم بطباعة الأمر 
program drop all‏ 


Local Macros : اطحلية‎ obl وحدات‎ 


clas,‏ الماكرو syle‏ عن أسماء (تصل إلى 31 حرفا lee‏ أن #رمز 
لسلاسل أو نتائج رقمية معرّفة ببرنامج أو قيم معرّفة للمستخدمين. an‏ 
الماكرو المحلية موجودة فقط مع البرامج التي elo‏ ولايمكن الإشارة إليها 
في برنامج آخرء ولانشاء وحدة ماكرو محلية باسم iterate‏ ترمز للرقم 0 قم 
بطباعة الأمر 
local iterate 0‏ 
وللإشارة إلى محتويات ماكرو محلي )0 في هذا المثال) قم بوضع اسم 
الماكرو بين علامة تنصيص فرديةء فمثلا 
display ^iterate'‏ 
0 


ولذا فإننا إذا US‏ نريد زيادة قيمة iterate‏ بقيمة canl y‏ فإننا نقوم بكتابة الأمر: 


local iterate = ^iterate' + 1 
display ‘iterate’ 
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بدلا من رقم. فإن محتويات الماكرو يمكن أن تكون سلسلة نصية أو 
قائمة من الكلمات مثل: 
locai islands Iceland Faroes‏ 
ولمشاهدة محتويات سلسلة نصية يتم وضع علامات تنصيص مزدوجة 
حول اسم الماكرو الذي يجب أن يكون مُحاطا بعلامة تنصيص مفردة: 


display " ' 2513205 ' " 
Iceland Faroes 


يمكننا أن نضع سلسلة إضافية من الكلمات أو أرقام إلى محتويات 
الماكروء فمثلا 


local islands 'islands' Newfoundland Nantucket 
display "'islands'" 
Iceland Faroes Newfoundland Nantucket 


قم بطباعة الأمر help extended fen‏ للحصول على معلومات أكثر عن 
دوال الماكرو الموسعة ببرنامج ستاتا حيث يقوم هذا الأمر بعرض معلومات 
عن محتويات وحدات c5 SU‏ فمثلا يمكننا الحصول على عدد الكلمات في 
الماكروء وحفظ هذا العدد كماكرو جديد بأسم showmany‏ 


local howmany: word count ` islands ' 
display "howmany' 


العديد من دوال الماكرو الموسعة الأخرى موجودة مع تطبيقات 
Olay‏ اطاکرو الشاملة : Global macros‏ 

تشبه وحدات الماكرو الشاملة وحدات الماكرو المحلية؛ ولكن عند 
تحديدها فإنها تبقى في الذاكرة» ويمكن استخدامها بواسطة برامج أخرى 
خلال فترة استخدامك لبرنامج ستاتا. وللإشارة إلى محتويات الماكرو الشاملة 
سوف نبدأ باسم الماكرو مع علامة دولار (بدلا من إرفاق الاسم في اليسار 
ويمين علامات الاقتباس كما تم مع وحدات الماكرو المحلية): 

global distance = 3 


display $distance * 2 
146 
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alls‏ نحدد بالضبط أننا نريد الاحتفاظ بمحتويات الماكرو لإعادة 
استخدامها لاحقاًء فإنه من الأفضل (أقل إرباكاً وأسرع في التنفيذ وأقل خطراً) 
استخدام ماكرو محلي بدلا من ماكرو شامل في كتابة البرامج» ولحذف 
ماكرو من الذاكرة تقوم باستخدام الأمر macro drop‏ 
macro drop distance‏ 
كما يمكننا حذف كل وحدات الماكرو من الذاكرة عن طريق الأمر: 
macro drop all‏ 


Scalars : yolol 


العدديات يمكن أن تكون أرقاماً أو سلاسل نصية يتم الإشارة Leal)‏ 
بواسطة اسم مثل وحدات الماكرو المحليةء ولاسترجاع محتوياتها لا نحتاج 
إلى إضافة اسم العدديّة ضمن علامات الاقتباس» فمثلاً: 

scalar onethird = 1/3 
display onethird 
433333333 
display onethird*6 
2 

العدديات مفيدة جداً عند حفظ النتائج الرقمية للعمليات الحسابية بدقة 
كاملة» فالعديد من إجراءات برنامج ستاتا التحليلية تحتفظ بالنتائج مثل 
درجات الحرية» وإحصائيات الاختبار» والأرجحيات المسجلة وغيرها 
كعدديات يمكن مشاهدتها بطباعة الأمر return list‏ أو ereturn list‏ بعد إتمام 
عملية التحليل. العدديات ووحدات الماكرو المحلية والمصفوفات والدوال يتم 
حفظها تلقائياً بواسطة برامج ستاتاء وهي تمشل الأساسيات التي يمكن 
استخدامها في البرامج الجديدة. 
الأمر : Version‏ 

قدرات برنامج Giu‏ تغيرت خلال فترة من الزمنء وبالتالي فإن كتابة 
البرامج للإصدارات القديمة ببرنامج ستاتا قد لا تعمل بشكل مباشر مع 
الإصدار الحالي» الأمر version‏ يعمل على حل هذه المشكلة حتى يمكن 
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استخدام البرامج القديمةء فعندما نحدد لبرنامج ستاتا الإصدار الذي تم 
استخدامه في كتابة البرنامج» فإن ستاتا يقوم بالتعديلات الضرورية حتى 
يمكن للبرنامج القديم العمل مع الإصدار الجديد لبرنامج ستاتاء فمثلاً إذا بدأنا 
البرنامج بالعبارة oli‏ فإن برنامج ستاتا يقوم باعتبار كل أوامر البرنامج 
كأنها مكتوبة بإصدار برنامج ستاتا رقم 9. 
version 9‏ 
كتابة الأمر version‏ في حد ذاته بدون أي إضافات تقوم بعرض 
الإصدار الحالي لبرنامج ستاتا. 
التعليفات : Comments‏ 
لا يقوم برنامج ستاتا بمحاولة تنفيذ أي سطر يبدأ بعلامة Asad‏ مثل هذه 
الأسطر يمكن استخدامها لإدراج تعليقات وشروحات في أي برنامج أو 
عرضها بشكل تفاعلي أثناء العمل على برنامج ستاتاء فمثلاً: 
This entire line is a comment.‏ * 
وبدلاً من ذلك» يمكننا إدراج تعليق في السطر الذي يحتوي على الملف 
التنفيذي نفسه» وأبسط طريقة للقيام بذلك تتم بوضع التعليق بعد علامة / 
مزدوجة (مع مسافة واحدة على الأقل قبل علامة / المزدوجة)» Ade‏ 


summarize logsize age // this part is the 
comment 


كما يمكن استخدام علامة // ثلاثية (يجب يجب أن يسبقها مسافة واحدة على 
الأقل) تشير إلى أن الذي يتبع هذه العلامات حتى نهاية السطر هو cyi‏ 
والسطر اتی ہی صيارة مع أدر يجب كقية: للم قور das‏ اند 
فمثلاً: 


summarize logsize age /// this part is the 
comment 
educ income 


حيث يتم تنفيذه وكأننا قمنا بطباعته كأمر: 


summarize logsize age educ income 
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التالي يجب قراءته كاستمرار للسطر السابق» فمثلا السطرين أدناه سوف تتم 

قراءتهما كأمر aal y table‏ حتى بعد فصلهما بواسطة الضغط على مفتاح 

لإدخال: 


table married sex, /// 
contents (median age) 


علامات // الثلاثية Suu E‏ ل dfdelimit;‏ وهي طريقة تم شرحها 
سابقاً لكتابة أوامر البرامج التي تكون أطول من سطر واحد. 
بوضعها بين علامة */ وعلامة /* فمثلا: 


table married sex, /* this is the comment */ 
contents (median age) 


إذا انتهى أحد الأسطر بعلامة */ فإن السطر التالي يبدأ بعلامة /* ثم يقوم 
برنامج ستاتا بتخطي الفاصل بين السطرين ويقرأ كلا السطرين وكأنهما أمر 
واحد» ويُفضل استخدام علامة // 
الحلقات : Looping‏ 
هناك عدد من طرق إنشاء حلقات البرامج» huf af‏ هذه الطرق 
تستخدم الأمر forvalues‏ فمثلا البرنامج ادناه يقوم بالعد من 1 إلى 5. 
Program that counts from one to five‏ * 
program count5‏ 
version 12.1‏ 
forvalues i = 1/5 (‏ 
display ^i'‏ 
end‏ 
بطباعة هذه الأوامر نحن نقوم بتعريف البرنامج Yuy counts‏ فخ eS‏ 
يمكننا استخدام محرر الملف التنفيذي Do-File Editor‏ لحفظ سلسلة من الأوامر 
ce‏ ككل ملف count5.do aul ASCII‏ ثم نقوم بطباعة الأمر oli‏ الذي يجعل 
برنامج ستاتا يقرأ الملف 


.do count5 


660 الإحصاء مع برنامج ستاتا 


الطريقة الأخرى تتم من خلال تعريف البرنامج counts‏ وذلك بجعل هذا 
المتغير كأنه أمر جديد 
.count5‏ 


Ui حير‎ UC) نم‎ ES 


الأمر: 
forvalues i - 1/5 (‏ 
يقوم بتخصيص وحدة ماكرو محلية i‏ لأعداد صحيحة متتالية من 1 
وحتى 5» الأمر هو 
display `i'‏ 
الأمر أعلاه يعرض محتويات الماكروء اسم الماكرو : تم اختياره 
عشوائياًء وهناك تركيبة أخرى للأمر تسمح لنا بالعد من 0 إلى 100 بفرق 5 
sss; LOS <0)‏ 100(: 
forvalues j = 0(5)100 {‏ 
الخطوات بين القيم ليس بالضرورة أن تكون aÍ‏ صحيحة طالما 
النهاية واحدة؛ وللقيام بالعد من 4 إلى 5 باستخدام زيادة 0.01 )4.00 
4.01« 4.02 ... 5.00( نقوم بكتابة: 
forvalues k - 4(.01)5 (‏ 
أي سطر يحتوي على أوامر ستاتا صحيحة بين أقواس البداية والنهاية 
( ) يتم تنفيذها بطريقة متكررة لكل القيم المحددة وبغض النظر عن 
التعليقات الاختيارية فلا شيء في سطر الأمر يتبع قوس البداية» Ld‏ قوس 
النهاية فيتطلب أن يكون هناك سطر خاص به. 
الأمر foreach‏ يستخدم طريقة yas Aikaa‏ من تحديد مجموعة من القيم 
الرقمية التنفيذية» فإننا نقوم بإعطاء قائمة بالعناصر التي يحدث بها التكرارء 
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هذه العناصر يمكن أن تكون متغيرات أو ملفات أو سلاسل نصية أو قيم 
رقمية. ولمعرفة كيفية تركيبة هذا الأمر قم بطباعة foreach‏ ماعط. 

الأمر forvalues‏ والأمر foreach‏ تقوم بإنشاء حلقات ests‏ هذه الحلقات 
بتكرار أرقام محددة مسبقاً dad‏ مرات» إذا كنا نريد الحلقات أن تستمر حتى 
E‏ :شر رطا Djs‏ فان الأمر while‏ سوف يكون مفيدًا في ذلك. . جزء من 
البرنامج مع الشكل العام أدناه سوف يقوم بشكل متكرر بتنفيذ الأوامر 
الموجودة بين QE SIE‏ المعكوفة ( { هذا التكرار سوف يستمر طالما أن تقييم 
برنامج "russa" expression‏ " 


“true 


while expression { 
command A 
command B 


} 
command Z‏ 
كما رأينا في المثال السابق» فإن قوس الإقفال ( يجب أن يكون في سطر 
منفصل خاص به وليس في نهاية سطر أي أمر. 
عندما يكون تقييم “false” (a expression‏ فإن الحلقات تتوقف ويقوم 
برنامج ستاتا بتنفيذ الأمر «Z‏ وبنفس ما قمنا به في المثال السابق» فإن التالي 
برنامج مبسط يقوم باستخدام حلقة while‏ التي تعرض على الشاشة تكرار 
الأرقام من 1 إلى 6: 
Program that counts from one to six‏ * 
program count6‏ 
version 12.1‏ 
local iterate - 1‏ 
while "iterate' <= 6 (‏ 
display “iterate!‏ 
local iterate = ^iterate' + 1‏ 


end 
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الحلقة الأكثر أهمية تظهر في برنامج 0 سوف يتم شىرحه 
lin‏ في هذا الفصل. وللحصول على معلومات أكثر عن ذلك قم بالاطلاع 
على دليل المستخدم -Programming Referen :e Manual‏ 
If... else‏ 
الأمر if‏ والأمر else‏ يحددان لبرنامج ما أن يقوم بشيء واحد إذا كان 
الشرط lassus expression‏ ويقوم بشيء آخر إذا لم يتوافر هذا <b pill‏ وتثم 
كتابة هذا الشرط US‏ يلي: 
if expression (‏ 
command A‏ 
command B‏ 


} 
else {‏ 
command Z‏ 
} 
فعلى سبيل المثال» هناك جزء في البرنامج أدناه يقوم بفحص ما إذا 
كانت محتويات الماكرو المحلي span‏ عدا فرديا وإيلاغ المستخدمين 


if int(^span'/2) != (^span' - 1)/2 + 
display "span is NOT an odd number" 


} 
else { 
display "span IS an odd number" 


Arguments : الشروط‎ 


البرامج تحدد الأوامر الجديدة» في بعض الأمثلة LS)‏ كان الوضع في 
المثال السابق (counts‏ قررنا أن الأمر سوف يقوم بنفس الشيء بالضبط في 
كل مرة يتم استخدامه» وفي الغالب نحن نحتاج إلى أمر يتم تغييره بواسطة 
شروط مثل أسماء المتغيرات أو الخيارات. هناك طريقتان يمكننا بهما أن 
نحدد لبرنامج ستاتا كيف يقرأ ويفهم سطر الأمر الذي يحتوي على شروط 
del‏ هذه الطرق هي استخدام الأمر args‏ 
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cee‏ 

الملف التنفيذي do-file‏ أدناه (listresI.do)‏ يُعراف برنامج يقوم بحساب 
انحدار متغيرين» ثم يضع المشاهدات في قائمة مع أكبر بواقي ills‏ الأمر 
listresl‏ يعرض sxc‏ أشياء خاطئة مثل استبعاد متغيرات وترك متغيرات 
جديدة أخرى في c SIS‏ والتي يمكن أن يكون لها تأثيرات جانبية غير 
مرغوبة. وعموما فإن هذا الأمر يساعد في توضيح استخدام المتغيرات 
المؤقتة. 

* Perform simple regression and list 
observations with # 


* largest absolute residuals. 


* syntax: listresl Yvariable Xvariable # 
IDvariable 


capture drop program listresi 

program listresl1, sortpreserve 
version 12.1 
args Yvar Xvar number id 
quietly regress ^Yvar' ^Xvar' 
capture drop Yhat 
capture drop Resid 
capture drop Absres 
quietly predict Yhat 
quietly predict Resid , resid 
quietly gen Absres = abs(Resid ) 
gsort -Absres 
drop Absres 
list  ^id' `yvar' Yhat | Resid in 
1/^"number' 

end 


args Yvar Xvar number id huli‏ يحدد لبر نامج ستاتا شر Hes‏ لار بع 

وحدات ماكرو. هذه الشروط يمكن أن تكون أرقاماً أو أسماء متغيرات أو 

سلاسل نصية أخرى يتم الفصل بينها بمسافة. . أول شرط هو استخدام 

محتويات ماكرو محلي اسمه Yvar‏ و الثاني ماكرو محلي أسمه Xvar‏ وهكذاء 

بعد ذلك يقوم الأمر باستخدام محتويات وحدات الماكرو هذه في أوامر أخرى 
مثل الانحدار: 


quietly regress ^Yvar' ^Xvar' 
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البرنامج يقوم بحساب قيم البواقي المطلقة (Absres)‏ ثم يستخدم الأمر 
gsort‏ (مع علامة ناقص قبل اسم المتغير) لترتيب البيانات من أعلى إلى 
أسفل مع وضع القيم المفقودة في الأخير: 

gsort -Absres_ 

الخيار sortpreserve‏ في سطر الأمر يجعل هذا البرنامج 'يحافظ على 
الترتيب' TTE‏ المشاهدات هو نفسه بعد تشغيل البرنامج كما 
كان قبل التشغيل: 

ملف Nations2.dta cia‏ يحتوي على alla‏ 194 دولة تتعلق بنسبة 
انبعاث ثاني أكسيد الكربون CO)‏ لكل شخص (c02)‏ والناتج المحلي الإجمالي 
لكل شخص (country) ál gall els (gdp)‏ يمكننا فتح .هذا Cabell‏ واس تخدامه 
لتوضيح البرنامج الجديذ؛ الأمر do‏ يقوم بتشغيل الملف التنفيذي do-file‏ 
المُسمى oden 5 Jistres].do‏ الطريقة يُعرّف البرنامج الأمر الجديد :listres]‏ 


.use C:\data\Nations2.dta,. clear 
.do C:\data\listres1 


ثم بعد ذلك نقوم باستخدام m‏ الجديد الذي تم تعريفه وهو listres]‏ 
يتبع شروطه الأربعة. الشرط الأول: يحدد المتغير روالثاني: x‏ والثالث: e‏ 
عدد المشاهدات التي يجب وضغها في قائمة» والرابع: يُعطي هذه الحالة رقماً 
TRES‏ في هذا المثال xi voli‏ يقوم بإعداد قائمة بالمشاهدات التي لها 

: أكبر قيم بواقي مظلقك:‎ 
.listresi co2 gdp 5 country 







country 










Qatar 210.65 114.4057 96.2443 
Bahrain 102.65 45.54433 57.10566 


5 Trinidad/Tobago 89.25 34.18739 55.06261 
8 Kuwait 118.2 67.83949 50.36051 
. United Arab Emirates 120.85 79.20002 41.64998 


في هذه الدول الخمس المصدرة للنفط انبعاث ثاني أكسيد الكربون لكل 
فرد أعلى من المتوقع. 


جع م يبا Ur‏ 
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gu ded‏ ل م 
الأمر : Syntax‏ 


الأمر syntax‏ يُعتبر طريقة معقدة» Lab ‘i,‏ مفيدة لقراءة سطر أي 
o4l‏ « الأمر التنفيذي أدناه والمسمى listres2.do‏ يُشبه الأمر: السابق» OSI,‏ 
يستخدم الأمر syntax‏ بدلا من Largs Yl‏ 


*Perform simple or multiple regression and list 
*observations with # largest absolute 
residuals. 
*listres2 yvar xvariist [ifl [in], number (#) 
[id (varname) ] 
capture drop program listres2 
program listres2, sortpreserve 
version 12.1 
syntax varlist(min=1) [if] [in], 
Number (integer) [Id(varlist)] . 
marksample touse 
quietly regress "varlist' if "touse' 
capture drop Yhat 
capture drop Resid 
capture drop Absres 
quietly predict Yhat if ^touse' 
quietly predict Resid if "touse', resid 
quietly gen Absres = abs (Resid_) 
gsort -Absres ' i 
drop Absres_ 
list ^id' ^1' Yhat_ Resid_ in 1/`number' 
end 


الأمر listres2‏ له نفس وظيفة I‏ 1 حيث يقوم بحساب 
الانحدارء ثم يقوم بإنشاء قائمة للمشاهدات مع أكبر cå ilha sila‏ هذا 
الإصدار الجديد من الأمرء يحتوي على عدة تحسينات» والتي أمكن الحصول 
gle‏ عن طريق الأمر syntax.‏ والأمر الجديد غير مقيّد بانحدار ذي 
متغيرين كما حدث في الأمر .listresl‏ الأمر listres2‏ سوف يعمل مع ع أي 
عدد من المتغيرات التنبؤية بما فيها تلك التي تكون قيمها المتوقعة تساوي 
Cl sein daa gia‏ روو اقيها هى انحرافات من المتوسط. الأمر listres2‏ 
يسمح بخيارات ol Ls dny if‏ استخدام متغير ما يُحدّد المشاهدات» وهو 
:اختياري مع الأمر Ya listers?‏ من أن تكون المشاهدات مطلوبة كما كان 
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الوضع مع الأمر distresl‏ فمثلاً يمكننا حساب انحدار انبعاث ثاني أكسيد 
الكربون على الإنتاج المحلي الإجمالي» ونسبة المناطق الحضارية» مع حصر 
التحليل ليشمل الدول في المنطقة 2 فقط وهي دول أمريكا. 


.do C:\data\listres2.do 
.listres2 co2 gdp urban if region -- 2, n(5) 
i(country) 


country 


Trinidad/Tobago 89.25 47.63852 41.61148 


Barbados 16.65 35.0574 -18.40739 

Saint Kitts/Nevis 10.05 26.28106 -16.23106 
Antigua and Barbuda 19.3 34.44279 -16.1428 
Suriname 19.45 5.137903 14.3121 


oP بن‎ No | 





سطر الأمر syntax‏ في هذا المثال يوضح بعض السمات العامة للأمر: 


syntax varlist(min-1) [if] [in], Number 
(integer) [Id(varlist)] 


قائمة المتغيرات للأمر listres2‏ يجب أن تحتوي على اسم متغير واحد 
على الأقل ((1حمنص)هناءه»» الأقواس تشير إلى شروط اختيارية» وهي في 
هذا المثال المحددات ims if‏ والخيار ( dd(‏ والحروف الكبيرة الأولى 
للخيارات تشير إلى أقل مشاهدة يمكن استخدامهاء وحيث إن سطر syntax‏ في 
هذا المثال تم تحديده Number(integer) Id(varlist)‏ والأمر الواقعي يمكن 
كتابته كما يلي: 
.listres2 co2 gdp, number(6) id(country)‏ 
أو يمكن كتابته كما يلي 
.listres2 co2 gdp, n(6) i(country)‏ 
محتويات الماكرو المحلي number‏ يجب أن تكون TM ha‏ هي 
أسماء متغير واحد أو أكثر. 
هذا المثال يشرح Lal‏ الأمر marksample‏ والذي يجعل العينة الفرعية 
(مثل التي تم تحديدها بواسطة AL (in y if‏ للاستخدام في تحليلات لاحقة. 


الفصل الرابع عشر : مقدمة في البرمجة 667 
تركيبة الأمر syntax‏ تم تلخيصها في دليل المستخدم Programming‏ 
Manual‏ فتجربة ودراسة البرامج الأخرى تساعد في فهم هذا الأمر. 
أمثلة عن doll‏ - برناصة multicat‏ (الرسم lull‏ للعديد من 
اطتغيرات النوعية) : Example Program: multicat‏ 
(Plot Many Categorical Variables)‏ 
في الأجزاء السابقة» تم شرح ISI‏ بسيطة وأمثلة عن برامج قصيرة. 
في هذا الجزء سوف نطبق هذه الأفكار على برامج أكبر تحدد إجراء 
TN‏ جديدًا -multicat awh‏ 
وبيانات وإجراءات البحث الاستقصائي تتضمن العديد من المتغيرات 
النوعية أحياناً قد تصل إلى 100 متغير ssi j‏ مقتطفات من الاستطلاع 
الاجتماعي العام لسنة 2010 توفر لنا Loos Sits‏ مع 9 متغيرا أغلبها 
ردود نوعية على أسئلة الاستطلاع. 
.use C:\data\GSS_2010_SwS.dta, clear‏ 


¿describe 
Contains data from C:\data\GSS_2010_SwS.dta 
obs: 809 General Social Survey 2010--evolution 
etc. 
vars: 23 6 Mar 2014 01:41 
size: 34,787 
CS  ———— MÀÀÀ——À — 
storage display value 
variable name type format label variable label 
——ee ااال‎ 
id int %B.0g Respondent ID number 
year int %8.0g GSS year 
wtssall float %9.0g LABCM probability weight 
cendiv byte %15.0g cendiv Census division 
logsize float %9.0g 1og10 (size place in 1,000s, +1) 
age byte $8.0g age Age in years 
nonwhite byte $9.0g nonwhite Consider self white/nonwhite 
sex byte %8.0g sex Respondent gender 
educ byte *8.0g educ Highest year of schooling 
married byte %9.0g yesno Currently married 
income06 byte — $15.0g income Total family income 
polviews byte $12.0g polviews Polit views liberal-conservative 
bush byte 59 و0.‎ yesno Voted for Bush in 2004 
obama byte *9.0g yesno Voted for Obama in 2004 
postlife byte $8.0g yesno Believe in life after death 
grass byte %9.0g grass Should marijuana be legalized? 
gunlaw byte $9.0g gunlaw Oppose permit required to buy gun 
sealevel byte $10.0g sealevel Bothered if sea level rose 20 ft 
evolve byte %9.0g true Humans developed/ earlier species 
recendiv float %9.0g random-effect intercept cendiv 
raneduc float %9.0g random-effect slope educ 
toteduc float $9.0g total random + fixed-effect slope educ 
fixeduc float %9.0g fixed-effect slope educ (constant) 


Sorted by: id 
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كخطوة أولى في استكشاف مثل هذا النوع من البيانات أو إعداد تقرير 
تمهيدي» فإننا قد a gai‏ بإعداد جداول تعرض نسبة التوزيعات لكل متغيرء 
الأمر أدناه سوف يقوم بإنشاء ثمانية جداول لكل المتغيرات الموجودة Me‏ 

.evolve وحتى المتغير‎ polviews e ملف البيانات من‎ 
.tabl polviews - evolve 


عموماً برنامج ستاتا لأيوفر طريقة مبهلة et]‏ وحفظ La jl‏ البياني 
للأعمدة لقائمة متغيرات» وكمثال عن البرمجةء فإن هذا dape zal‏ 
decis ripe n‏ ا العمل مع بحوث 
الدراسات الاستطلاعية الأكثر تعقيد 


بر multicat gil‏ — و det‏ تم تعريفه بواسطة ملف do-file‏ أدناه — 
والذي تم إنشاؤه بناء على برنامج اسمه catplot‏ كتبه مستخدم آخر تم شرحه 
في الفصل 4< catplot jay!‏ يمكنه رسم عدد مثنوع من الأشكال البيانية التي 
تعرض توزيعاً متغيرًا heg‏ برنامج multicate‏ متخصص أكثر في إنشاء 
الرسم البياني للأعمدة الأفقية» بحيث تكون هناك نسبة مئوية لكل فئة. ولكن 
هذا التنسيق مفيد لعرض بيانات الدراسات الاستقصائيةء برنامج multicat‏ له 
القدرة على العمل مع قائمة بها عدة متغيرات لا يمكن ل catplot‏ وأوامر 
الرسم البياني الأخرى ببرنامج ستاتا التعامل معها. وبالتالي» يمكننا أن 
نستخدم برنامج multicat‏ في رسم أعمدة بيائية أفقية لكل متغير في البيانات 
الموجودة لديناء وحفظ كل شكل بياني على حدة. البرنامج يحفظ الأشكال 
البيانية بتنسيقين اثنين» الأول بتنسيق ستاتا الذي له امتداد (JA  «(gph)‏ 
بواحد من bac‏ تنسيقات emf, eps, pdf)‏ بناءً على نظام التشغيل) وأسماء هذه 
الملفات سوف يكون بناءً على أسماء المتغيرات» ويمكنك تغيير أي من هذه 
المواصفات» وذلك من خلال تحرير الملف anulticat.ado‏ وتعديل البرنامج 
بطريقة تلائم احتياجاتك التحليلية. 


*! version 2.0 21jun2012 

*! L. Hamilton, Statistics with Stata (2012) 

* Requires catplot.ado installed. Graphs are 
saved in default directory. 

program define multicat 
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version 12.1 

syntax varlist [if] [in] [aweight fweight 

iweight] /// 

[, MISSing BY(varname) OVER(varname) ] 

if "^over'" I= mm { 
display as error  "over() option not 
allowed with multicat;" 
display as error "use by() option or try 
catplot command 





instead." 
exit 198 
} 
marksample touse, strok novarlist 
if "‘weight'" != "" local Weighted = 
"Weighted" 


if "‘c(os)'"=="Windows" + 
local filetype "emf" 
} 


else if "‘c(os)'"=="Unix" ( 
local filetype "eps" 


} 
else if "^c(os)'"-z"MacOSX" { 
local filetype - "pdf" 
} 
else { 
display as error "unknown operating 
System: ^c(os)'" 
exit 799 
} 
capture { 
if "bytn I= un { 
foreach var of varlist ^varlist' { 
local Vlab_: variable label `var' 
catplot hbar ‘var' [^weight' 
"^exp'] if ^touse', /// 
blabel(bar, format (%3.0f£)) /// 
percent (`by') ytitle("^Weighted ' 
Percent") /// 
“missing' by(^by', 
title(""Vlab '", size(medium))) 
graph save -"by'-^var'.gph, replace 
graph export -"by'-"var'."filetype', 
replace 
} 
} 


else { 
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foreach var of varlist ‘varlist' { 
quietly tab `var' if ^touse', "^missing' 
local Nofobs = r(N) 
local Vlab : variable label "var' 
catplot hbar ^var' [^weight' ~exp'] if 
^touse', /// 
blabel(bar, format(%3.0£)) /// 
percent ytitle(""Weighted ' Percent, 
N = ^Nofobs '") /// 
title("^Vlab '", size (medium) ) 
^missing' ‘options’ 
graph save Graph -‘var'.gph, replace 
graph export -^var'."filetype', replace 
} 
} 
} 
error _rc 
end 


المسافة في بداية الأسطر ليس لها تأثير على تتفيذ البرنامج» ولكن تجعل 
قراءة البرامج أسهل للمبرمجين» الشيء الجوهري في برنامج multicat‏ هو 
تركيبة جملته «syntax‏ ومن ثم حلقة foreach‏ التي تقوم بشكل متكرر elhel‏ 
أمر catplot‏ لكل متغير في قائمة المتغيرات. وحدات الماكرو المحلية ترسل 
معلومات إلى الأمر catplot‏ الذي يقوم بدوره برسم الأشكال البيانية» الأمر 
مح E RENTRER‏ لها سا oth aay Ab‏ الأوز لق gi dolla‏ 
الأمر LS csvy:tab‏ يسمح كذلك بالمحددات df sin‏ وبشكل اختياري يمكننا 
إدراج القيم المفقودة missing‏ واستخدام by()‏ ولكن لايمكننا استخدام -over()‏ 

برنامج multicat‏ تمت كتابته Cus ina di‏ تم البدء مع ملف do-file‏ 
اسمه multicat.do‏ وكانت البداية مع إدخال المكونات مثل جملة التركيب» ثم 
بعد ذلك تشغيل هذا الملف لمشاهدة كيف يعمل قبل إضافة أي مكونات 
أخرى» ويجب ملاحظة أن تشغيل الملفات التجريبية لا يقوم بإخراج نتائج 
مورضية قي بطباعة Jl‏ 


eset trace on 
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حيث يأمر برنامج ستاتا بعرض البرامج خط بخط بنفس ترتيب تنفيذهاء 
وبذلك يمكننا مشاهدة أين يحدث الخطأ بالضبطء ولاحقا يمكننا أن نقوم بإيقاف 

هذه الميزة بطباعة الأمر 
.Set trace off‏ 


النسخة التمهيدية onulticatdo ald‏ فإن السطر الأول يحتوي على 
capture program drop multicat‏ مهمته حذف البرنامج من الذاكرة قبل 
تعريفه مرة أخرى؛ وهذا ضروري في مرحلة الكتابة والتشصحيح أوعندما 
تكون النسخة السابقة من البرتامج ناقصة أو غير صحيحة» وعموماً gji‏ مثل 
هذا السطر يجب حذفه عند إتمام كتابة البرتامج. 

عندما نعتقد بأن ملف do-file‏ يقوم بتعريف برنامج نرغب في استخدامه 
مرة أخرىء فيمكننا إنشاء ملف cado-file‏ ويمكن القيام بذلك من خلال حفظ 
الملف مع امتداد (Lad, cado(multicat.ado)‏ حفظ الملف في المجلد 
ado\personal‏ وقد تحتاج إلى إنشاء هذا المجلد إذا لم يكن fag a ge‏ مسبقاء 
يمكن الحفظ في المجلدات الأخرى» ولكن يجب مراجعة دليل المستخدم 
User's. Manual‏ لمعر فة أين يبحث ستاتا عن ملفات fado-files‏ قبل 
الاستمرارء وعند إتمام ذلك فيمكننا استخدام multicat‏ كأمر اعتيادي ضمن 
برنامج ستاتا. 

يمكن تحسين البرنامج لجعله أكثر مرونة وأناقة وسهولة» ويجب ملاحظة أن 
تضمين الأوامر مصدر البرنامج ”2.0 version‏ في أول سطرين واللذين يبدآن 
بعلامتي !* فهذا الأمر يشير إلى الإصدار الثاني من ملف multicat.ado‏ وليس 
إصدار ستاتا (الإصدار السابق من ملف multicat.ado‏ يظهر في الإصدار السابق 
من هذا الكتاب)ء إصدار ستاتا المناسب لتشغيل هذا البرنامج تم تحديده على 
أساس أنه الإصدار 12.1 version‏ والذي يظهر في سطور لاحقة في البرنامج» 
بالرغم من أن الأوامر التي fas‏ !* لا تؤثر على الطريقة التي يعمل بها البرنامج» 
إلا أنه يمكن مشاهدتها بواسطة الأمر which‏ 


. which multicat 

.Mnulticat.ado 

*! version 2.0 21jun2012 

*! L. Hamilton, Statistics with Stata (2012) 
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Using Multicat : Multicat استحدام برنامة‎ 


بعد حفظ الملف Su.) multicat.ado‏ تم a his‏ في المجلد 
(C:\ado\personal‏ فإن الأمر multicat‏ يصبح قابلاً للاستخدام كأنه j‏ من 
أوامر ستاتا العادية (حتى وإن لم تكن مكتملة)؛ الشكل )1.14( يعرض 
إجابات بخصوص وجهات نظر سياسية» النسب والأرقام للمشاهدات تظهر 
في الرسم البياني. 
.multicat polviews, missing‏ 
Polit views liberal-conservative‏ 
Extreme lib‏ 
Liberal‏ 
Slightly lib‏ 
Moderate‏ 
Slightly con‏ 
Conservative‏ 
Extreme con‏ 


DK/NA 


0 100 200 300 
Percent. N = 809 


الشكل )1.14( 


بيانات الاستطلاع يتم تحليلها عموماً باستخدام الأوزان الاحتمالية 
ويجب أن يتم تحديد أن البيانات هي بيانات استقصائية باستخدام svyset‏ كما 
سبق» وإن تم شرحه في الفصل )4(« تطبيق الأوزان على البيانات 
الاستقصائية svy: tab‏ يوضح أن الردود أدناه للإجابات عن تشريع اس تخدام 
متخثل ACE‏ 


.Svy: tab grass, percent miss 
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vA‏ لرا اا ا ي AA‏ 


(running tabulate on estimation sample) 





Number of strata  - i Number of obs z 809 

Number of PSUs = 809 Population size = 812.73293 
Design df = 808 

———LTL———— 

Should 

marijuana 

be 

legalized 

? percentages 

Key: percentages - cell percentages 


هذا السؤال له نوعان من القيم المفقودة» حوالي 5 من المشاركين في 
الدراسة تم سؤالهم عن مخدّر المارجواناء ولكنهم أجابوا بأنهم لا يعرفونه» 
هذه القيم المفقودة تم ترميزها ب a‏ مع توصيفها “DK”‏ وحوالي نسبة 
G‏ کے la py ol te‏ سی وام کی رع فن اا 
grass‏ وهؤلاء تم ترميزهم بالرمز ib‏ مع توصيف للقيم ب NA”‏ بيانات 
GSS‏ تحتوي على عدد كبير من الأسئلة» حيث بها أسئلة مختلفة لعينات 
فرعية» ومن ناحية تحليلية» > فإن ذلك يجعل للبيانات معنى» حيث يمكننا 
استبعاد المجموعة التي لم يتم سؤالها أسئلة معينة وحساب النسب» وبذلك نجد 
أن هناك انقساماً متساوياً: نحو %46 لصالح تشريع المارجواناء 5 9646 ضد 
مع وجود نسبة حوالي %8 لم يتخذوا قرارًا. 
.Svy: tab grass if grass< .b, percent miss‏ 


674 


524 
526.30952 
523 


"oon 
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(running tabulate on estimation sample) 


Number of strata  - 1 ‘Number of obs 
Number of PSUs = 


524 Population size 
Design af 








Should 
marijuana 
be 

legalized 


? percentages 


Key: percentages = cell percentages 


الأمر multicat‏ (الذي تم إنشاؤها ely‏ على الأمر (catplot‏ لا يفهم E‏ 
svy:‏ أو الأوزان الاحتمالية» ولكن الأوزان التحليلية لها نفس التأثير هناء 
الشكل )2.14( يعرض tabs Ysa‏ للأمر multicat‏ يتعلق بالجدول de)‏ 
ويُلاحظ بأن الشكل البياني للأمر multicat‏ لاحظ بأن حجم العينة (524). 


.multicat grass if grass« .b [aw = wtssall], miss 


Should marijuana be legalized? 


Legal 


DK 


م 


0 50 100 150 
Weighted Percent, N = 524 


الشكل (2.14) 
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هناك سلسلة من sac‏ أشكال بيانية تشبه الشكل (2.14) تم استيعادها في 
المستند أو الشرائح المعروضة ويمكن قراءتها وإضافة ملاحظات عليها 
التعقيد المصاحب للقيم المفقودة لديناء هنا مثال سريع يمكننا من خلاله 
استخدام الأمر multicat‏ لرسم 8 أعمدة بيانية للمتغيرات من المتغير 
polviews‏ إلى المتغير ast Cus evolve‏ الأمر بحفظ كل USA‏ بياني بطريقة 
آلية مع ela‏ ملفات e «polviews.gph cha‏ يتم بعد ذلك استخدام الأمر 
graph combine‏ لدمج الأشكال البيانية معا في صورة واحدة لتكوّن الشكل 
)3.14( | 
emulticat polviews-evolve [aw = wtssall]‏ 
.graph combine -polviews.gph -bush.gph -‏ 
obama.gph -postlife.gph‏ 


-grass.gph -gunlaw.gph -sealevel.gph - 
evolve.gph 


Polit views liberal-conserv Voted for Bush in 2004 Voted for Obama in 2004 


Extreme lib 
rere 1 1 No No 


ore 
ee alive Yes Yes 
reme con 


0 00 o 50 100 150 200 250 0 200 300 


100 200 3 100 
probability we ght Weighted Percent. N = 462 Weighted Percent. N = 517 


Should marijuana be legalizecOppose permit required to buy gun 
Not Favor 
Yes Legal Oppose 


200 400 600 0 50 100 150 200 250 0 200 400 600 
Weighted Percent. N = 714 Weighted Percent. N = 485 Weighted Percent. N = 804 


Not at all 
Little 
Somewhat 
Great deal 


O 100 200 300 400 
Weighted Percent. N = 595 


الشكل )3.14( 


البحوث الاستقصائية تصبح أكثر إثارة عندما نقارن بين المجموعات 
الفرعية» فمثلاً الفصل المنتظم حول تشريع المارجوانا يظهر بشكل cà hia‏ 
عندما نقوم بتقسيم الإجابات على أساس الجنس في الشكل (4.14). 


emulticat grass [aw = wtssall], by(sex) 
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Mages. Roep REM MC ——— A d‏ 


Should marijuana be legalized? 
Male Female 


Legal 





0 50 100 150 0 


Weighted Percent 
Graphs by Respondent gender 


الشكل )4.14( 


وفي هذا «QS‏ يعرض basg multicat yaY!‏ أكثر عند المقارنة بين 
الأشكال البيانية» الأوامر أدناه تقوم بإنشاء 8 أشكال بيانية ol SU‏ وتقسيم هذه 
الآراء sU‏ على الجنس ثم تجميع 4 أشكال بيانية في شكل واحد تظهر في 
الشكل )5.14( نرى أن ردود GLY!‏ أكثر اعتقادا بأن هناك حياة بعد الموت 
)86 مقابل %76( كما أنهن يعارضن تشريع تعاطي المارجوانا (57 مقابل 
%43( وهن يساندن تصريح استخدام السلاح )77 مقابل %68( ويرفضن 
الآراء المتعلقة بالتطور البشري )49 مقابل %39( 


.multicat polviews-evolve [aw = wtssalll, by (sex) 
.graph combine -sex-postlife.gph -sex-grass.gph - 
sex-gunlaw.gph 

-sex-evolve.gph 
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لقصل رابج Se‏ 


Believe in life after death Should a be legalized? 
Male Female Female 
No No 
Yes Yes Legal 
© 100 200 300 400 0 100 200 300 400 0 5 100 1 150 0 50 100 150 
Weighted Percent Weighted Percent 
Graphs by Respondent gender Graphs by Respondent gender 
Oppose permit required to buy gun Humans developed/ earlier species 
Male Female Male Female 
Favor Favor False False 
Oppose Oppose 
0 100200300400 0 100200300400 0 50 100150200250 0 50 100150200250 
ا ج‎ Percent ا‎ oaiind Percent 
Graphs by Respondent ger Graphs by Respondent 
> 
(5.14) الشكل‎ 


تم استخدام الأمر graph combine‏ في الشكلين )14 .3( ;)14 .5( qa‏ 
الأشكال البيانية وتوضيح ماقام به -multicat Al‏ وقي البحوثء فإن العدد 
الفعلي للأشكال البيانية عادة يفوق ما نريد إدراجه في USA‏ بياني cals‏ 
والأمر CS: 4345 multicat‏ سهولة رسم 0 شكل بياني» ومقارنة إجابات 
المشاركين في الدراسات الاستقصائية من حيث الجنس ثم إجراء 100 مقارنة 
أخرى من حيث مستوى التعليم والفئة العمرية والانتماء السياسي والجغرافي 
وأي تصنيفات أخرى لها أهمية للباحث؛ أغلب عمليات التحليل سوف لن 
تحتاج إلى هذا الأمر الخاص» ولكن عندما تكون هناك احتياجات معينة في 
بحث ماء فإن البرامج المؤقتة من هذا النوع قد تكون ضرورية. 
ملف امطساعدهة : Help File‏ 


ملفات المساعدة هي سمة أساسية عند استخدام برنامج ستاتاء فالبرامج 
المكتوبة بواسطة المستخدمين multicat.ado Sus‏ يمكن أن تصبح أكثر أهمية 
لعدم وجود توثيق خاص بها في دليل المستخدم» ويمكننا كتابة ملف مساعدة 
لبرنامج multicat.ado‏ بواسطة استخدام Editor‏ 20-516 لإنشاء ملف نصتي 
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bia ya j multicat.sthlp eo‏ هذا الملف في نفس مجلد 200-516 (فمثلا 
يتم حفظه في مجلد (C:\ado\personal‏ الذي يحتوي على ملف .multicat.ado‏ 
أي ملف نصي يتم حفظه في أي مجلد معروف لبرنامج ستاتا بأنه مجلد 
خاص بملفات 200-516 ويكون الملف النصي المحفوظ بتنسيق filename.sthlp‏ 
سوف يتم عرضه على الشاشة بواسطة ستاتا عند طباعة الأمر help‏ 
© | ر فمثلاً قد نقوم بكتابة الأمر أدناه في نافذة Do-file Editor‏ وحفظ هذا 
الملف في المجلد onulticat.sthlp ex C:\ado\personal‏ ثم نقوم بطباعة الأمر 
help multicat‏ في أي وقت» فإن برنامج ستاتا سوف يعرض النص. 
multicat -- Multiple bar charts of categorical‏ 
variables)‏ 
multicat varlist [aw = weightvar] [if exp] [in‏ 


rangel, 
[missing] [by(groupvar)] 


Description 


multicat draws horizontal bar charts showing 
percentages of 

categorical variables. It saves one chart for 
each of the variables in varlist. Graphs are 
saved in the current default directory, with 
file names based on variable names preceded by 
a hyphen, such as  -vote.gph or  -region- 
vote.gph. They are saved both in Stata's .gph 
format and one other graphical file format 
(.emf, .eps or .pdf) depending on operating 
system. 


Using analytical weights [aw - weightvar] with 
multicat will result in percentages equivalent 
to those obtained by svy: tab applied to data 
declared as survey type, by a command such as 
svyset [pw = weightvar]. The svy: prefix cannot 
be used with multicat itself. Chapter 14 in 
Statistics with Stata 

(2012) has examples and discussion of multicat. 


multicat requires that catplot is installed. 
Type 


الفصل الرابع عشر : مقدمة في البرمجة | 679 


findit catplot for instructions on installing 
this unofficial 
program, written by Nicholas Cox. 





Options 
missing includes missing values in the bar 
chart and calculated percentages. 


by(groupvar) draws an image containing separate 
small charts for each value of groupvar. 


Examples 
multicat. party wrongtrack vote 
multicat party-vote [aw = weightvar], miss 


multicat party-vote [aw = weightvar], 
by (region) 


References 


Hamilton, Lawrence C. 2012. 
Statistics with Stata. Belmont, CA: Ceng 


ملفات المساعدة المفيدة هي تلك التي تحتوي على روابط ونصوص 
منسقة ومربعات حوار وميزات أخرى يمكن تصميمها باستخدام 
JS Stata Markup and Control Language (SMCL)‏ ملفات المساعدة الرسمية 
ببرنامج ستاتاء وملفات التسجيل» والنتائج المعروضة على الشاشة تقوم 
باستخدام SMEL‏ والتنسيق المرغوب؛ لملفات المساعدة بصفة عامة موجود 
في دليل لامستخدم User's Guide‏ . 
paill‏ أدناه عبارة عن نسخة من SMCL‏ لملف مساعدة خاص 
بغهه اسم تتبع تقريباً توجيهات دليل المستخدم» aic y‏ حفظ هذا الملف في 
multicat.sthlp e ado\personal alas‏ ثم نقوم بطباعة الأمر help multicat‏ 
سوف يظهر وكأنه ملف مساعدة رسمي. ١‏ 
(smcl)‏ 


(* *! version 2.0 21ju12012)1...) 
(cmd:help multicat) 
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(hline) 


(title:Title) 

{phang} 

{bf :multicat -- Multiple bar charts of 
categorical variables} 


{title:Syntax} 

{p 8 17 12} 

{cmd :multicat} {it:varlist} [(it:weight)] 

[{cmd:if} {it:exp}] 

[ETHOS YF Û ts 
yt Ltcmdasb:nsm 


sra {cmd 
: iss 
[{cmd:by (} {it:groupvar} {cmd: ) } 


ge} ] 
ing} 1 


| ١ه‏ مه 


(title:Description) 


(pstd) 

(cmd:multicat) draws horizontal bar charts 
showing percentages ofcategorical variables. It 
saves one chart for each of the variablesin 
{it:varlist}. Graphs are saved in the current 
default directory,with file names based on 
variable names preceded by a hyphen, suchas 
{it:-vote.gph} or {it:-region-vote.gph}. They 
are saved both inStata's .gph format and one 
other graphical file format (.emf, .epsor .pdf) 
depending on operating system. 


{pstd} 

Using analytical weights {cmd: [aw = 
}{it:weightvar} {cmd:]} with 

{cmd :multicat} will result in percentages 
equivalent to those 

obtained by  (cmd:svy: tab} applied to data 
declared as survey type,by a command such as 
{cmd:svyset [pwz)(it:weightvar)í(cmd:1). 
The(cmd:svy:) prefix cannot be used with 
(cmd:multicat) itself. Chapterl 4 in {brow 
se 

"http://www.Stata.com/bookstore/statistics- 
with-stata/index.html": 

Statistics with Stata) (2012) has examples and 
discussion of (cmd:multicat). 
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(pstd) (cmd :multicat) requires that 
(cmd:catplot) is installed.  Type(cmd:findit 
catplot) for instructions on installing this 
unofficialprogram, written by Nicholas Cox. 


(title:Options) 


(phang) 

(cmdab:miss:ing) includes missing values in the 
bar chart and 

calculated percentages. 


(phang) 
{femd:by(}{it:groupvar}{cmd:)} draws an image 
containing separate 

small charts for each value of {it:groupvar}. 


{title:Examples} 


{phang} 
(cmd:. multicat party wrongtrack vote} 


(phang) 
(cmd:. multicat party-vote [aw 
miss) 


weightvar], 


(phang) 
(cmd:. multicat party-vote [aw 
by(region)) 


0 


weightvar], 


(title:References) 


(pstd) 

Hamilton, Lawrence C. 2012. 

(browse 
"http://www.stata.com/bookstore/statistics- 
with-stata/index.html": 

Statistics with Stata). Belmont, CA: 
Cengage. {p_end} 


ملف المساعدة يبدأ ب {smel}‏ الذي يأمر برنامج ستاتا باعتبار الملف 
من نوع SMCL‏ الأقواس المعكوفة () تتضمن رموز SMCL‏ والعديد منها له 
J {command:text} ($14‏ تنسيق {command arguments:text}‏ و الأمثلة 
أدناه توضح LES‏ تفسير هذه الرموز. 
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{emd:help 
multicat} 


(hline) 
ftitle:Title) 
{phang} 


{bf:multicat- ...} 


يعرض النص “help  multicat?‏ كأمر > حيث يعرض 
*help multicat"‏ بأي لون وحروف الخط يتم عرضها 
يعرض النص “Title”‏ كعنوان. 

يقوم بإدراج مسافة بادئة للفقرة النصية التالية. 


يعرض النص بخط عريض. 


{p 8 17 12}‏ يقوم بتنسيق النص التالي كفقرة مع مسافة بلدئة 
بمقدار 8 حروف والسطور التالية مع مسافة بادئة 
7 حرفا والهامش الأيمن يتم تضييقه بمقدار 12 
حرفا. 
{it:varlist}‏ يعرض النص LAs varlist‏ مائل. 
 (cmdab:miss:ing)‏ يعرض كلمة “missing”‏ كأمر مع جعل حروف 
“miss”‏ كأقل اختصار. 
{browse "http://www.stata.com/bookstore/statistics-with-‏ 


stata/index.html" Statistics...) 
(URL) مع موقع‎ “Statistics with Stata” يربط النص‎ 


http://www.stata.com/bookstore/statistics- نت‎ yl 
with-stata/index.html 


Cys‏ إن النقر على “Statistics with Stata”‏ سوف 
يفتح متصفح الإنترنت على هذا الرابط. 


دليل المستخدم Programming Manual.‏ يوفر تفاصيل أكثر عن اس تخدام 
هذه الأوامرء والعديد من أوامر SMCL‏ الأخرى. 
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olo‏ مونت Monte Carlo Simulation : oU‏ 


محاكاة مونت كارلو تقوم بإنشاء وتحليل العديد من عينات البيانات 
Arar sll‏ مما يسمح للباحثين بالتحقق من سلوك نقنياتهم الإحصائية في المدى 
الطويل. الأمر simulate‏ يجعل عملية تصميم المحاكاة واضحة وسهلة» Cus‏ 
إنها تتطلب ae‏ بسيطا من البرامج الإضافية. في هذا الجزء» سوف يتم 
عرض مثالين عن ذلك. 

عند البداية مع المحاكاة نحتاج إلى تعريف البرنامج الذي يقوم بإنشاء 
عينة واحدة من بيانات عشوائية ثم يحللها ويحفظ النتائج ذات العلاقة في 
الذاكرة. الملف التالي يُعرّف برنامج r-class‏ (قادر على bia‏ نتائج ( ):) باسم 
meanmedian‏ هذا البرنامج asi‏ عشوائياً بإنتاج 100 قيمة للمتغير »دمن 
توزيع طبيعي معياري» ثم يقوم c Usb‏ 100 قيمة للمتغير w‏ من توزيع 
طبيعي ملوّث: N(0,1)‏ مع احتمالية 0.95 و N(0,10)‏ مع احتمالية 0.05« 
التوزيعات الطبيعية الملوّثة يتم استخدامها في العادة في دراسات المتانة 
لمحاكاة المتغيرات التي تحتوي على أخطاء شاذة عرضية:؛ بالنسبة لكلا 
المتغيرين» فإن meanmedian‏ يقوم بحساب المتوسطات وقيم الوسيط. 


* Creates a sample containing n-100 
observations of variables x 
and w. 
* x-N(0,1) x is standard 
normal 
* weN(0,1) with p=.95, w-N(0,10) with p=.05 w 
is contaminated 
normal 
* Calculates the mean and median of x and w. 
* Stored results: r(xmean) r(xmedian) r(wmean) 
r(wmedian) 
program meanmedian, rclass 
version 12.1 
drop 1 
set obs 100 
generate x - rnormal() 
summarize x, detail 
return scalar xmean - r(mean) 
return scalar xmedian = r(p50) 
generate w = rnormal() 
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replace w - 10*w if runiform() « .05 
summarize w, detail 
return scalar wmean - r(mean) 
return scalar wmedian - r(p50) 
end 


meanmedian Liye WY,‏ كأمر r-class‏ مثل summarize‏ الذي يمكنه 

أن يحفظ نتائجه في قيم عددية ( )»2 ag meanmedian‏ بإنشاء أربع قيم 

عددية r(xmean)‏ و r(xmedian)‏ لمتوسط ووسيط المتغيرء ونفس الشيء 
لمتوسط ووسيط المتغير Cus w‏ تكون -r(wmean), r(wmedian)‏ 


عند تعريف pu meanmedian‏ |* باستخدام do-file‏ أو ado-file‏ أو من 
خلال طباعة الأوامر بشكل تفاعلي» يمكننا أن نستخدم هذا البرنامج مرة 
أخرى من خلال الأمر csimulate‏ ولإنشاء بيانات جديدة تحتوي على 
المتوسطات وقيم الوسيط للمتغير x‏ والمتغير رمن 5,000 عينة عشوائية 
نقوم بطباعة الأمر التالي: 


.Simulate xmean = r(xmean) xmedian = r(xmedian) 
wmean =  r(wmean) wmedian =  r(wmedian), 
reps(5000): meanmedian 


command: meanmedian 
xmean: r(xmean) 

xmedian: r(xmedian) 
wmean: r(wmean) 

wmedian: r(wmedian) 


Simulations (5000) 
xmean, xmedian, wmean, wmedian هذا الأمر يقوم بإنشاء المتغيرأت‎ 


بناءً على نتائج (): من كل تكرار ل meanmedian‏ 


6 
.describe 
Contains data 
obs: 5,000 simulate: meanmedian 
vars: 4 27 Mar 2014 22:50 
size: 80,000 
storage display value 
variable name type format label variable label 
xmean float $9.0g عد‎ (xmean) 
xmedian float %9. 0g x (xmedian) 
wmean float %9. 0g x (wmean) 
wmedian float %9.0”q x (wmedian) 


Sorted by: 


. summarize 
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Variable Obs Mean Std. Dev. Min Max 






5000 -.0023419 .1011693  -.3493929 -3718835 





xmedian 5000 -.0014787 .1251765  -.4686761 -5143458 
wmean 5000 -.002392 2431499 7.994046 .905769 
wmedian 5000 .0010861 .1282183  -.5034871 4793077 


المتوسطات لهذه المتوسطات وقيم الوسيط خلال 5000 عينة كلها 
تقريباً قريبة للصفرء وتتوافق مع توقعاتنا ob‏ متوسط ووسيط العينة يُفتر 
أن يوفرا تقديرات غير متحيّزة لمتوسطات المجتمع الصحيح ( (o‏ لمتغير × 
والمتغير oy‏ وكما هو متوقع نظرياء فإن المتوسط يبدو أقل تبايناً من الوسيط 
من عينة لأخرى عند تطبيقه على متغير × موزع توزيعاً طبيعياء « الانحراف 
المعياري للمتغير xmedian‏ يساوي 5 وهو أكبر بدرجة كبيرة من 
الانحراف المعياري (0.101). ee‏ و واه i‏ 
غير طبيعي أو متغير يتأثر بالقيم المتطرفةء فإن العكس يكون صحيحا 
الانحراف المعياري للمتغير wmedian‏ أقل بكثير من الانحراف "m‏ 
للمتغير wmean‏ (0.128 مقابل 4 تجربة مونت كارلو توضح بأن 
الوسيط يبقى مقياساً مستقرًا نسبياً للمركز بالرغم من وجود القيم المتطرفة 
الشاذة à‏ في التوزيع الملوّثء بينما bu giall‏ ينخفض ويتنوع OSA,‏ كبير من 
e‏ الشكل (6.14) يعرض مقارنة بيانية للشكل الصندوقي 
(وبالصدفة يعرض كيفية التحكم في أشكال الصندوق البيانية وعلامات القيم 
المتطرفة)» » ولإنشاء مسافة لأربعة متغيرات في مربع شرح لصف واحد» 
فسوف نقوم برسم الرموز بنصف حجمها الواقعي "ymxsize(*.5))‏ 

¿graph box xmean xmedian wmean wmedian, 
yline(0) 
legend(row(1) symxsize(*.5)) 


marker (1, msymbol (+) ) marker (2, 
msymbol (Th) ) 


marker (3, msymbol (Oh) ) marker (4, 
msymbol (Sh) ) 
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[E r(xmean) ZH r(xmedian) EJ rwmean C3 r(wmedian) | 


الشكل )6.14( 


مثالنا التالي يوسّع التحقق إلى طرق الثقة جامعاً Lee‏ عدة موضوعات 
من هذا الكتاب. برنامج regsim‏ يقوم بإنشاء 100 مشاهدة للمتغير x‏ 
(الطبيعي القياسي) ومتغيرين اثنين ل y‏ حيث إن yl‏ هو Ala‏ خطية للمتغير 
+ زائداً الأخطاء الطبيعية المعيارية» 2ر هو Alla Laj‏ خطية للمتغير × ولكن 
يضيف الأخطاء الطبيعية الملوّثة» هذه المتغيرات تساعد في اكتشاف سلوك 
عدة طرق انحدار في وجود توزيعات طبيعية وغير طبيعية لها أخطاء ذات 
خطأ ذو انحراف كبير في منحنى التوزيع الطبيعي» تم استخدام أربع طرق 
هي : 

المربعات الصغرى العادية «(regress)‏ والانحدار الموثوق (rreg)‏ 
والانحدار الربيعي (areg)‏ والانحدار الربيعي مع الأخطاء المعيارية 
المتكيّسة bootstrapped standard errors‏ (الأمر bsqreg‏ 500 تكرار)؛ 
الموثوقية والانحدار الربيعي (الفصل 8). نظرياً يجب أن يُثبت مقاومة أكثر 
لتأثيرات القيم المتطرفة» ومن خلال تجربة محاكاة مونت كارلو نقوم باختبار 
ما إذا كان ذلك صحيحاء الأمر regsim‏ يقوم بتطبيق US‏ طريقة لانحدار 
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المتغير 1ر على المتغير × ثم بعد ذلك على انحدار المتغير y2‏ على المتغير 
»» وفي هذا التمرين سوف يتم تعريف البرنامج عن طريق ملف ado-file‏ 
المُسمى regsim.ado‏ و الذي تم حفظه في المجلد -ado\personal‏ 


program regsim, rclass 

* Performs one iteration of a Monte Carlo 
simulation comparing 

* OLS regression (regress) with robust (rreg) 
and quantile 

* (qreg and bsqreg) regression. Generates one n 
- 100 sample 

* with x ~ N(0,1) and y variables defined by 
the models: 





MODEL 1: y1 = 2x + el e1 ~ N(0,1) 


+ ROB X 


MODEL 2: y2 - 2x + e2 e2 - N(0,1) with p - 
.95 
e2 ~ N(0,10) with p = .05 


خ# + * 


Bootstrap standard errors for qreg involve 
500 repetitions. 

* 

version 12.1 

if i A == ">?" { 

global S 1 "b1 bir selir biq selq selqb /// 
b2 b2r se2r b2q se2q se2qb" 

exit 

} 

drop _all 

set obs 100 

generate x = rnormal() 

generate e = rnormal() 

generate yl = 2*x +e 


reg yl x 

return scalar 81 =  b[x] 
rreg yl x, iterate(25) 
return scalar B1R = _b[x] 
return scalar SE1R =  se[x] 
qreg yl x 

return scalar B1Q = _b[x] 
return scalar SE1Q = _se[x] 
bsqreg Y1 x, reps(500) 
return scalar SE1QB = _se[x] 


replace e = 10 * e if runiform() < .05 
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generate y2 = 2*x + e 


reg y2 x 

return scalar B2 = _b[x] 
rreg y2 x, iterate(25) 
return scalar 22R = _b[x] 
return scalar SE2R = _se[x] 
qreg y2 x 

return scalar B2Q = _b[x] 
return scalar SE2Q = . se[x] 
bsqreg y2 x, reps(500) 
return scalar SE2QB = _se[x] 
end 


برنامج r-class‏ يقوم بحفظ تقديرات الأخطاء المعيارية والمعاملات من 
ثمانية تحليلات انحدارء والنتائج يتم إعطاؤها أسماء مثل: 
r(Bl)‏ معامل من انحدار OLS‏ للمتغير yl‏ على المتغير Xx‏ 
r(BIR)‏ معامل من الانحدار الموثوق للمتغير y]‏ على المتغير x‏ 
r(SEIR)‏ الخطأ المعياري لمعامل الثقة من النموذج 1 
وهكذاء كل انحدارات الربيعات وانحدارات الثقة تتضمن تفاعلات 
متعددة: عادة من خمسة cll‏ عشرة تفاعلات للأمر rreg‏ وحوالي خمسة 
للأمر bac g qreg‏ آلاف للأمر bsqreg‏ مع 500 إعادة تقدير متكيسة لحوالي 
خمسة تفاعالات لكل dine‏ ولهذا فإن أمراً تنفيذياً aly‏ للبرنامج 1 يقوم 
بتحديد أكثر من 2,000 انحدارء والأمر أدناه يحدد خمسة تكرارات تتطلب 


أكثر من 10,000 انحدار. 


.Simulate 1ط‎ = r(B1) bir = r(B1R) selr = r(SE1R) 
biq = r(B1Q) seiq = r(SE1Q) seigb = r(SE1QB) 
2ط‎ = r(B2) 
b2r = r(B2R) se2r = r(SE2R) b2q = r(B2Q) 
se2q = r(SE2Q) 
se2qb = r(SE2QB), reps(5): regsim 


حت مويو ee‏ = 
إلى c5‏ أطول wm‏ الأكبر؛ ملف البيانات ess‏ يحتوي ae‏ نتائج 
من تجربة تضمنت 500 تكرار لبرنامج regsim‏ وهي أكثر من مليون 
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— eee ee ee anl ad ce 


c jas‏ مُعاملات الانحدار وتقديرات الخطأ المعياري التي تم الحصول عليها 
من هذه التجربة تم تلخيصها في الجدول أدناه. 





.describe 
Contains data from C:\data\regsim.dta 
obs: 500 Monte Carlo estimates of b in 500 
samples of n-100 
vars: 12 2 Jul 2012 06:11 
size: 24,000 
storage display value 
variable name type format label variable label 
Ssh 
bl float %9.0g r(B1) 
blr float %9.0g r (BIR) 
selr float %9.0g r (SEIR) 
biq float $9.0g r(B1Q) 
selg float %9.0g x (SE1Q) 
selgb float %9.0g r(SE1QB) 
b2 float %9.0g r(B2) 
b2r float %9.0g r(B2R) 
se2r float %9.0g r(SE2R) 
b2q float %9.0g r(B2Q) 
562 float $9.0g r(SE2Q) 
se2qb float %9.0g r(SE2QB) 
eee 
Sorted by: 


.Summarize 






Variable Obs Mean Std. Dev. Min Max 


——————O 












bi 1.99586 .104467 1.692893 2.293595 
bir 500 1.996901 .1077322 1.698501 2.294482 
selr 500 1046559 -0108543 -0789753 .1523494 
biq 500 1.99658 .1246462 1.638891 2.370703 
selq 500 313393 .0206363 .0801532 -2059937 






.1373001 .0321417 .0532386 -2581546 











b2 500 1.986367 -2604184 1.066318 2.90484 
b2r 500 1.997187 .1127494 1.674992 2.307488 
se2r 500 .1087309 .0117741 . 081064 -1564037 
b2q 500 1.996925 .1314325 1.591606 2.370703 








-1416007 -0212944 . 0880669 -2220859 
500 1456451 .0343871 -0560117 -2704635 






se2qb 
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مربع شرح الرسم قابلا للقراءة سوف نقوم باستخدام الخيارات 
legend(symxsize(*.3) colgap(*.3))‏ والذي يقوم بتوسيع الرموز والفراغات 
بين الأعمدة في مربع شرح ipa gl‏ بحيث تظهر بحجم 0 من حجمها 
الافتراضي» الأمر help legend option‏ والأمر ola yu help relativesize‏ 
معلومات أكثر عن هذه الخيارات. 
b2r b2q,‏ 2ط graph box bi bir big‏ . 
ytitle("Estimates of slope (b=2)")‏ 
yline (2) legend (row (1) symxsize(*.3)‏ 
colgap(*.3)‏ 
label(1 "OLS 1") label(2 "robust 1") label(3‏ 
"quantile 1")‏ 


label(4 "OLS 2") label(5 "robust 2") label(6 
"quantile 2")) 


e 


25 


2 


Estimates of slope (b=2) 





1.5 
L. 





OLS 1 El robust 1 E quantile 103 OLS 2 C} robust 2 Œ] quantile 2 





الشكل )7.14( 


نماذج الانحدار الثلاثة OLS)‏ والموثوق والربيعي) أنتجت معامل متوسط 
يقوم بتقدير النموذجين» وهذه التقديرات ليست مختلفة معنويا عن اانيمة 

الصحيحة 2= م c‏ ويمكن تأكيد هذا من خلال اختبارات + مثل: 
.ttest b2r = 2‏ 
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One-sample t test 





Variable Obs Mean Std. Err. Std. Dev. [95$ Conf. Interval] 
b2r 500 1.997187 .0050423 .1127494 1.987281 2.007094 
mean = mean(b2r) t = -0.5578 

Ho: mean = 2 degrees of freedom = 499 
Ha: mean < 2 Ha: mean != 2 Ha: mean > 2 

Pr(T « t) = 0.2886 Pr(|T| > |t|) = 0.5772 Pr(T > t) = 0.7114 


كل نماذج الانحدار تعطي تقديرات غير متحيزة ل B‏ ولكن تبايناتها 
وكفاءتها تختلف من عينة لأخرى. وعند تطبيقها على نموذج الأخطاء 
الطبيعية 1 فإن cu OLS‏ بأنه الأكثر فعالية» وذلك كما توقعت نظرية 
جاوس ماركوف «Gauss-Markov‏ كما أن الانحراف المعياري المشاهد 
لمُعاملات OLS‏ يساوي 0.1045 مقارنة مع 0.0177 للانحدار الموثوق 
و0.1246 للانحدار الربيعي» والكفاءة النسبية والتي تعرض التباين المشاهد 
لمعامل OLS‏ كنسبة من تباين tle‏ آخر تعتبر طريقة معيارية لمقارنة مشل 
هذه الإحصائيات: 


. quietly summarize 1 
. scalar Varb1 = r(Var) 
. quietly summarize bir 
. display 100*(Varb1/r(Var) ) 
94.030265 


. quietly summarize big 
. display 100*(Varb1/r(Var)) 
70.242519 


الحسابات أعلاه تستخدم نتيجة تباين r(Var)‏ من الأمر «summarize‏ 
سوف نقوم أولاً بالحصول على تباين تقديرات OLS‏ للمتغير 81 ثم نجعل تلك 
القيمة قيمة عددية carb]‏ بعد ذلك يتم الحصول على تباينات التقديرات 
الموثوقة bir‏ وتقديرات الربيعات blg‏ ومقارنتها مع Varb]‏ هذا يوضح أن 
الانحدار الموثوق كان تقريبا %94 كفء مثل كفاءة OLS‏ عند تطبيقه على 
نموذج الأخطاء الطبيعية وهو قريب من نسبة كفاءة العينة الكبيرة 9695 
وهذه هي الطريقة التي يُفترض أن تكون موثوقة «(a1992 Hamilton) jt‏ 
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وفي المقابل» فإن الانحدار الربيعي يحقق كفاءة نسبية قدرها 9670 تقريباً مع 
نموذج الأخطاء الطبيعية. 

FS‏ ممائلة لنموذج الأخطاء الملوثة يعطي صورة مختلفة» حيث إن 
OLS‏ كان J‏ فضل (الأكثر كفاءة) ge‏ مع e Usa MI‏ الطبيعيةء ولكنه قد يكون 
الأسوأ مع الأخطاء الملوثة. 


. quietly summarize 52 

. Scalar Varb2 - r(Var) 

. quietly summarize b2r 
display 100*(Varb2/r(Var)) 

533. 47627 


. quietly summarize b2q 
. display 100*(Varb2/r(Var)) 
392.58875 


القيم المتطرفة في نموذج الأخطاء الملوثة يؤدي بأن تكون تقديرات 
معاملات OLS‏ متباينة بشكل كبير من عينة لأخرى. والذي يمكن ملاحظته 
بوضوح في الصندوق الرابع بالشكل )7.14(« تباين مُعاملات OLS‏ أكبر 
خمس مرات من التباين المتعلق بالمُعاملات الموثوقة» وأكبر بأربع مرات 
تقريباً من المُعاملات الربيعية. وبعبارة أخرى فقد تم إثبات أن الانحدار 
الربيعي» والانحدار الموثوق LADS‏ أكثر أستقراراً من OLS‏ في وجوذ القيم 
المتطرفة معطياً في المقابل أخطاء معيارية أقل وفترات ثقة أضيق» 
والانحدار الموثوق يتفوق على الانحدار الربيعي مع نماذج الأخطاء الطبيعية 

ونماذج الأخطاء الملوثة. 
الشكل )8.14( يعرض مقارنة بين OLS‏ والانحدار Lass dus geia‏ 
شكل انتشار ل 500 زوج من معاملات الانحدار. معاملات OLS‏ (المحور 
العمودي) يتباين أكثر بكثير حول القيمة الصحيحة "2.0" أكثر من معاملات 

rreg‏ (المحور الأفقي). 
graph twoway scatter b2 b2r, msymbol (dh)‏ . 

ylabel(1(.5)3, grid) 


yline(2) xlabel(1(.5)3, grid gmin gmax) 
xline(2) 
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aad. adco‏ ا ي RR‏ 


ytitle("OLS regression coef, contaminated 
errors") 

xtitle("Robust regression coef, 
contaminated errors") 
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الشكل )8.14( 


كما أن تجربة مونت كارلو تعرض معلومات حول الأخطاء المعيارية 
المقدرة في ظل كل طريقة وكل نموذج. . متوسط الأخطاء المعيارية المقدرة 
يختلف عن الانحراف المعياري المشاهد للمُعاملات. والاختلاف بين الأخطاء 
المعيارية الموثوقة بسيط نسبياًء حيث إنه أقل من 964 ونظرياً فإن اختلافات 
الأخطاء المعيارية الربيعية أكبرء حيث إنها 967 تقريباء التقديرات المقبولة 
Ai gaal‏ أخطاء ربيعية متكيّسة تم الحصول عليها بواسطة الأمر 
cbsqreg‏ ومتوسطات الأخطاء المعيارية المتكيّسة تفوق الانحراف المعياري 
المشاهد للمتغير b/g‏ والمتغير 2 بحوالي 10 أو 1 5395 أن التكيّس 
يُبالغ في تقدير التباين من Aue‏ لأخرى. 

محاكاة مونت كارلو أصبحت إحدى الطرق الرئيسة في البحوث 
الإحصائية الحديثةء كما أنها تلعب دورا متزايدًا في التعليم الإحصائي» هذه 
الأمثلة توضح بعض الطرق السهلة لمعرفة طريقة استخدامها. 
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برمجة امصفوفات Matrix Programming with Mata : Mata £o‏ 
لغة برمجة المصفوفات ببرنامج ستاتا تسمى Mata‏ وتم شرحها 
بالتفصيل في إصدارين بدليل المستخدم «Mata Matrix Programming‏ هذا 
الموضوع الضخم لا يقع ضمن نطاق هذا الكتاب؛ ولكن يتناسب مع هذا 
الفصل الختامي» حيث سنلقي نظرة سريعة على Mata‏ حيث إن أدواته 
البرمجية تفتح مجالات جديدة لتطوير ستاتا. 
وبدلاً من قضاء فترة طويلة في شرح مفاهيم Mata‏ ومميزاتهاء سوف 
fas‏ مباشرة مع أمثلة عن كيفية كتابة برنامج يقوم بحساب انحدار المربعات 
الصغرى Cus «OLS‏ إن نموذج الانحدار البسيط هو: 
y=Xbtu‏ 
ex‏ إن AY‏ )1( موجه عمودي لقيم المتغير التابع» X‏ هي (nxk)‏ 
مصفوف تحتوي على قيم (عادة) 1 متغيرات تنبؤية وعمود u (d‏ هي 
(nx1)‏ موجه الأخطاءء b‏ هي (x1)‏ موجه مُعاملات الانحدار ويتم تقديرها 
كما gh‏ 
b -(X'X)! X'y‏ 
هذه الطريقة لحساب المصفوفة مألوفة لأجيال من طلبة الإحصاء. 
وتعتبر نقطة بداية مفيدة لمشاهدة كيفية عمل .Mata‏ 


ملف البيانات 6 رت يتضمن معلومات حول تكاليف إيقاف تشغيل 
خمسة مفاعلات طاقة نووية تم إقفالها في الفترة من 1982-1968( الميزة 
التعليمية في هذا المثال هي صغر حجم المصفوفات» حيث يمكن كتابتها 
بسهولة على السبورة أو الورق في حالة الحاجة إلى ذلك eg, Hamilton)‏ 
0 ؛»؛ فسوف تتم معرفة كيف أن تكاليف إيقاف التشغيل قد تكون لها 
علاقة مع قدرة المفاعل وسنوات التشغيل. 
use C:\data\reactor.dta, clear‏ . 
describe‏ . 
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Contains data from C:\data\reactor.dta 


obs: 5 Reactor decommissioning costs (from 
Brown et al. 1986) 
vars: 6 2 Jul 2012 06:11 
size: 110 
Storage display value 

variable name type format label variable label 

site 56214 $14s Reactor site 
decom byte %8.0g Decommissioning cost, millions 
capacity int $8.0g Generating capacity, megawatts 
years byte %9.0g Years in operation 
start int $8.0g Year operations started 
close int $8.0g Year operations closed 


Sorted by: start 


وبالطبع؛ فإن حساب انحدار OLS‏ مع برنامج deu Giu‏ جداًء حيث 
وجدنا أن تكاليف إيقاف التشغيل لهذه الخمسة مفاعلات زادت بحوالي 0.176 
مليون دولار )175,874 52 (I5‏ لكل ميجاوات قدرة على التوليد» وحوالي 
9 مليون دولار لكل سنة تشغيل. هذان المتغيران التنبؤيان يوضحان 
حوالي 7699 من تباين تكاليف إيقاف التشغيل (0.9895-,7). 


. regress decom capacity years 





Source | ss df MS Number of obs = 5 
F( 25 2) = 189.42 

Model 4666.16571 2 6 Prob < F = 0.0053 
Residual 24.6342883 2 12.3171442 R-squared = 0.9947 
Adj R-squared = 0.9895 

Total 4690.8 4 1172.7 Root MSE - 3.5096 








decom Coef. Std. Err. t P»|t| [95$ Conf. Interval] 













.1758739 .0247774 7.10 0.019 .0692653 .2824825 
3.899314 .2643087 14.75 0.005 2.762085 5.036543 
-11.39963 4.330311 -2.63 0.119 -30.03146 7.23219 











capacity 






years 
_cons 
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ملف ado-file‏ أدناه Cá yx‏ برنامج 0150 «Mata zdi leidas‏ وهو 
ببساطة يقوم بحساب موجه معاملات الانحدار cb‏ في هذا المثال أوامر Mata‏ 
تبدأ ب mata:‏ (هناك عدة طرق أخرى لاستخدام هذه الأوامر تفاعلياً أرقي 


برامج تم شرحها في دليل المستخدم)ء أول أمرين اثنين mata:‏ يقومان 
بتعريف الموجّه y‏ والمصفوفة X‏ كمعاينة للبيانات في الذاكرة وتم تحديدها 
بواسطة كل المتغيرات في الطرف الأيسر (Ins)‏ والمتغيرات في الطرف 
الأيمن (rhs)‏ التي تظهر سطر الأمر cols0‏ الثابت 1 يشكل آخر عمود في 
المصفوفة X‏ كما أن 01:0 يسمح بالمحددات هذ أو dif‏ القيم المفقودة 
والمعادلة المقذرة هي: 
b-(X'X)! X'y‏ 
ويتم كتابتها بلغة Mata‏ على الشكل التالي: 
mata: b - invsym(X'X)*X'y‏ 


أمر mata:‏ الرابع يعرض محتويات النتائج للمتغير b‏ 

*! 21jun2012 
*! L. Hamilton, Statistics with Stata (2012) 
program ols0 

version 12.1 

svntax varlist(min-1 numeric) [in] [if] 

marksample touse 

gen cons = 1 

tokenize "varlist' 

local lhs "^1'" 

mac shift 

local rhs "^*'" 

mata: st_view(y=., ., "` lhs'", "^touse'") 


mata: st_view(X=., .,  (tokens(""rhs'"), 
"Cons "), "^touse'") 


mata: b - invsym(X'X)*X'y 
mata: b 
drop cons. 

end 
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Se ce‏ - 
وعند تطبيق 0190 على بيانات إيقاف تشغيل المفاعلات النووية فإن 
معاملات الانحدار التي تم الحصول عليها تشبه تلك التي تم الحصول Lals‏ 
سابقا بو اسطة sregress jay]‏ 
ols0 decom capacity years ,‏ . 
a -1758738974‏ 


2 3.899313867 
3 -11.39963279 





عند | استخدام إصدارات Mata‏ للمعادلات المعيارية» فإن برنامج olsi‏ (في 
الصفحة التالية) agis‏ بإضافة حساب الأخطاء المعيارية وإحصائيات f‏ 
واحتمالات اختبار ct‏ ومرة أخرى نرى أن الحسابات تقود إلى نفس النتائج 
التي رأيناها سابقا مع الأمر cregress‏ الفواصل في AT‏ عبارة mata‏ ببرنامج 

1 هي عبارة عن عوامل وتعني 'قم بضم الأعمدة للمصفوفات التالية". 
21jun2012‏ !* 
L. Hamilton, Statistics with Stata (2012)‏ !* 
program olsi‏ 

version 12.1 

syntax varlist(min-1 numeric) [in] [if] 

marksample touse 

gen cons = 1 

tokenize "^varlist' 

local lhs "^1'" 

mac shift 

local rhs "^*:" 

mata: st view(yz., ., "^lhs'", ""touse'") 

mata: st view(X-., oe (tokens("^rhs'"), 

"cons "), "^touse'") 


mata: b - invsym(X'X)*X'y 
mata: e = y - X*b 

mata: n - rows(X) 

mata: k - cols(X) 

mata: s2 - (e'e)/(n-k) 
mata: V - s2*invsym(X'X) 


mata: se = sqrt (diagonal (V) ) 
mata: (5; se, b:/se, 2*ttail(n-k, 
abs (b:/se))) 
drop cons 
end 
. 0151 decom capacity years 
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1 2 3 4 


1 .1758738974 .0247774037 7.098156835 .0192756353 
2 3.899313867 - 26430873 14.75287581 .0045631637 
3 -11.39963279 4.330310729 -2.632520735 .1190686843 





يمكننا أن نوسع هذا qal pil‏ بحيث يحفظ النتائج ويعرضها في جداول 
ذات تنسيق أفضل يشبه تلك التي يعرضها الأمر ع البرنامج ols2‏ (في 
الصفحة m‏ يقوم بشيء مختلف حتى يوضح كيف أن irte‏ 
المصفوفات dien‏ حيث يقوم بدمج النتائج الرقمية المعروضة أعلاه ه في 
مصفوفات نصية تحتوي على عناوين Bred‏ وقائمة A‏ بأسماء المتغيرات 
المستقلة ويتم القيام بذلك من خلال أوامر 8 إضافية» asi‏ هذه الأوامر 
C‏ موجه الصف | vnames‏ والذي يحتوي على قائمة بأسماء المتغيرات. 
الفواصل في هذا الأمر تقوم بضم ثلاث مجموعات من الأعمدة: )1( العبارة 
"Yvar?‏ يتبعها اسم المتغيرات بالطرف الأيسرء )2( أسماء كل متغيرات 
الطرف الأيمن» )3( العبارة cons?‏ * 
mata:vnames -"Yvar: lhs'",tokens(""rhs'")," cons"‏ 
أمر 8 الطويل التالي يقوم باستخدام محدد التعليقات الموجودة ضمن 
سطر الأمر وهي */ و/* حتى يستطيع Mata‏ قراءة ما قبل نهاية آخر سطرين 
ويعتبر هذا كله كأمر واحد: 


mata: vnames ', ("Coef." ١ strofreal(b)), /* 
x7 ("Std. Err." \ strofreal(se)), 
«جم) رع‎ V  strofreal(t)),  ("P»|t|" \ 
strofreal (Prt) ) 


الأمر يعرض مصفوفة بها الصف الأول غيارة عن vnames_ gland‏ 
(وهو عمود أسماء المتغيرات). عمود أسماء المتغيرات مدمج باس تخدام 
فاصلة مع موجه العمود الثاني الذي تم إنشاؤه مع كلمة “Coefs”‏ كصف أول» 
LI‏ بقية الصفوف فتم تعبئتها بمعاملات b‏ والتي تم تحويلها من أرقام حقيقية 
m‏ حروف» LÍ‏ استخدام الشرطة الخلفية o‏ فإنها تدمج الصفوف إلى 
مصفوفة مثلما تفعل الفاصلة ”,“ التي تقوم بدمج الأعمدة. التحويل من أرقام 


الفصل الرابع عشر : مقدمة في البرمجة 699 
إلى حروف لقيم b‏ مهم لجعل أنواع المصفوفات Aii gia‏ وهناك عمليات 
ممثلة في ols?‏ من الأعمدة الموصوفة للأخطاء المعيارية وإحصائيات t‏ 
والاحتمالات. 





*! 21jun2012 
*! L. Hamilton, Statistics with Stata (2012) 
program ols2 
version 12.1 
syntax varlist(min=1 numeric) [in] [if] 
marksample touse 
gen cons_ = 1 
tokenize ‘varlist' 
local lhs "^1'" 
mac shift 
local rhs "^*'" 
mata: st view(yz., ., "^lhs'", "^touse'") 
mata: st view(X-., ki (tokens ("`rhs'"), 


"cons "), "`touse'") 
mata: b - invsym(X'X)*X'y 
mata: e = y - X*b 
mata: n - rows(X) 
mata: k - cols(X) 
mata: 52 - (e'e)/(n-k) 


mata: V = s2*invsym(X'X) 

mata: se - sqrt(diagonal(V)) 

mata: t - b:/se 

mata: Prt - 2*ttail(n-k, abs(b:/se)) 

mata: vnames = "Yvar: "1hs'", 
tokens(""rhs'"), " cons" 

mata: vnames ', ("Coef." ١ strofreal(b)), /* 

*/ ("Std. Err." ١ strofreal(se)), /* 

*/ ("t" V  strofreal(t)), ("P»|t|" N 
strofreal(Prt)) 

drop cons, 
end 


. Ols2 decom capacity years 


1 2 3 4 5 


Yvar: decom Coef. Std. Err. t P>|t| 
capacity 1758739 0247774 7.098157 .0192756 


years 3.899314 2643087 14.75288 .0045632 
—cons 711.39963 4.330311 -2.632521 .1190687 


م س هھ 
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تمارين Mata‏ — مثلها مثل الأمثلة الأخرى في هذا الفصل - تعطي 
لمحة عن البرمجة في ستاتا. كما أن مجلة ستاتا Stata Journal‏ تقوم بنشر 
تطبيقات أكثر توسعاً. وكل تحديث لبرنامج ستاتا يتضمن ملفات ado-files‏ 
جديدة b yha g‏ كما أن Online NetCourses‏ تعرض طرقاً إرشادية لتعليمك 
dal src cad‏ العاسقيك: 


مصادر البيانات 


Dataset Sources 


el 





المنشورات أو صفحات الإنترنت olif‏ تعرض بعض المعلومات. وهذه 
المعلومات مثل: التعريفات» والمصادر الأصلية للبيانات» وعرض أوسع عن 
البيانات التي تم استخدامها في أمثلة هذا الكتاب. في «lll‏ فإن بيانات 
الأمثلة هي مقتطفات من ملفات أكبرء أو تحتوي على متغيرات تم دمجها من 

أكثر من مصدر واحد. انظر قائمة المراجع للحصول على قائمة كاملة بها. 
aids.raw‏ 


aids.dta 
Selvin (1995) 


Alaska places.dta 
Hamilton et al. (2011) 


Alaska regions.dta 
Hamilton and Lammers (2011) 


Antarctic2.dta 
Milke and Heygster (2009) 


Arctic9.dta 
Sea ice extent: NSIDC (National Snow and Ice Data Center), Sea Ice Index. 
http://nsidc.org/data/seaice_index/ 


Sea ice volume: PIOMAS (Pan-Arctic Ice Ocean Modeling and Assimilation 
System), 


Polar Science Center, University of Washington. Arctic Sea Ice Volume 
Anomaly. 


http://pse.apl. washington. edu/wordpress/research/projects/arctic-sea-ice- 
volume-ano 


maly/ 
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Annual air temperature anomaly 64-90 °N: GISTEMP (GISS Surface 
Temperature 


Analysis), Goddard Institute for Space Studies, NASA. 
http://data.giss.nasa.gov/gistemp/ 


attract2.dta 
Hamilton (2003) 


Canadal.dta 
Canada2.dta 
Federal, Provincial and Territorial Advisory Committee on Population Health 
(1996) 
Climate.dta 


NCDC global iemperature: National Climatic Data Center, NOAA. Global 
Surface 


Temperature Anomalies. http://www.ncdc.noaa.gov/cmb-fag/anomalies.php 


NASA global temperature: GISTEMP (GISS Surface Temperature Analysis), 
Goddard 


Institute for Space Studies, NASA. http://data.giss.nasa.gov/gistemp/ 
UAH global temperature: Universicy of Alabama, Huntsville. 
http://vortex.nsstc.uah.edu/data/msu/t2It/uahnede. It 


Aerosol Optical Depth (AOD): Sato et al. (1993). Goddard Institute for Space 
Studies, 


NASA. Forcings in GISS Climate Model. 
http://data.giss.nasa.gov/modelforce/strataer/ 


Total Solar Irradiance (TSI): Fréhlich (2006). Physikalisch-Meteorologischen 


Observatoriums Davos, World Radiation Center (PMOD WRC). Solar 
Constant. 


http://www.pmodwrc.ch/pmod.php?topic-tsi/composite/SolarConstant 


Multivariate ENSO Index (MEI): Wolter and Timlin (1998). Earth Systems 
Research 


Laboratory, Physical Sciences Division, NOAA. Multivariate ENSO Index. 
http://www.esrl.noaa.gov/psd/enso/mei/mei.html 


Global average marine surface CO2: Masarie and Tans (1995). Earth System 
Research 


Laboratory, Global Monitoring Division, NOAA. Trends in Atmospheric 
Carbon 


Dioxide. http://www.esrl.noaa.gov/gmd/ccgg/trends/global.html#global_data 
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eee 


election_2004i.dta 
Robinson (2005). Geovisualization of the 2004 Presidential Election. 
http:/www.personal.psu.edu/users/a/c/acr 18 l/election.html 


electricity. dta 


California Energy Commission (2012). U.S. Per Capita Electricity Use by 
State, 2010. 


http://energyalmanac.ca.gov/electricity/us | per capita electricity-2010.html 


globall.dta 

global2.dta 

global3.dta 

global_yearly.dta 
Multivariate ENSO Index (MET): see climate. dta 
NCDC global temperature: see climate. dta 


Granite2011 6.dta 


Hamilton (2012). Also see *Do you believe the climate is changing?" by 
Hamilton (2011) 


athttp://www.carseyinstitute.unh.edu/publications/TB-Hamilton-Climate- 
Change-National- 


NH.pdf 


Greenland sulfate.dta 


Mayewski, Holdsworth et al. (1993); Mayewski, Meeker et al. (1993). Also see 
Sulfate and 


Nitrate Concentrations at GISP2 from 1750-1990. 
http://www.gisp2.sr.unh.edu/DATA/SO4NO3 html 


Greenland_temperature.dta 


GISP2 ice core temperature: Alley (2004). NOAA Paleoclimatology Program 
and World 


Data Center for Paleoclimatology, Boulder. 


fip://ftp.ncdc.noaa.gov/pub/data/paleo/icecore/greenland/summit/gisp2/isotope 
s/gisp2_temp 


_accum_alley2000.txt 
Summit temperature 1987-1999: Shuman et al. (2001) 


greenpopl.dta 
Hamilton and Rasumssen (2010) 





704 الإحصاء مع برنامج ستاتا 


GSS 2010 SwS.dta 


Davis et al. (2005). National Opinion Research Center (NORC), University of 
Chicago. 


General Social Survey. http://www3.norc.org/GSS+Website/ 


heart.dta 
Selvin (1995) 


lakewinl.dta 
lakewin2.dta 
lakewin3.dta 
lakesun.dta 
lakesunwin.dta 


Lake Winnipesaukee ice out: 
http://www.winnipesaukee.com/index.php?pageid-iceout 


Lake Sunapee ice out: 
http://www.town.sunapee.nh.us/Pages/SunapeeNH, Clerk/ 


Also see Hamilton et al. (2010a) at 
http://www.carseyinstitute.unh.edu/publications/IB Hamilton Climate Survey 
_NH.pdf 

MEIO. dta 

MEII.dta 
Multivariate ENSO Index: see climate. dta 


MiLwater.dta 
Hamilton (1985) 


Nations2.dta 
Nations3.dta 


Human Development Reports, United Nations Development Program. 
International Human 


Development Indicators. http://hdrstats.undp.org/en/tables/ 


oakridge.dta 
Selvin (1995) 


planets.dta 
Beatty (1981) 
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PNWsurvey2_11.dta 


Hamilton et al. (2010b, 2012). Also see “Ocean views” by Safford and Hamilton 
(2010), 


at http://www.carseyinstitute.unh.edu/publications/PB_Safford_DowneastMaine.pdf 


reactor.dta 
Brown et al. (1986) 


shuttle. dta 
shuttle0. dta 


Report of the Presidential Commission on the Space Shuttle Challenger 
Accident (1986) 


Tufte (1997) 


smokingl.dta 
smoking l.dta 
Rosner (1995) 


snowfall.xls 
Hamilton et al. (2003) 


southmigl.dta 
southmig2.dta 
Voss et al. (2005) 


student2.dta 
Ward and Ault (1990) 


whitemtl.dta 
whitemt2.dta 
Hamilton et al. (2007) 


writing.dta 
Nash and Schwartz (1987) 
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